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时 至 今日 ，Linux 系 统 已 经 从 一 个 个 人 作品 发 展 为 可 以 用 于 各 种 关键 任务 的 成 熟 、 高 效 和 稳定 的 操作 系统 ， 
因为 具备 跨 平台 、 开 源 、 支 持 众多 应 用 软件 和 网 络 协议 等 优点 ， 它 得 到 了 各 大 主流 软 硬 件 厂商 的 支持 ， 也 成 
为 广大 程序 设计 人 员 理想 的 开发 平台 。 

本 书 是 Linux 程 序 设计 领域 的 经 典 名 著 ， 以 简单 易 懂 、 内 容 全 面 和 示例 丰富 而 广 受 好 评 。 中 文 版 前 两 版 出 
版 后 ， 在 国内 的 Linux 爱 好 者 和 程序 员 中 引起 了 强烈 反响 ， 这 一 热潮 一 直 持续 至 今 。 本 书 是 国内 读者 狂 首 以 待 
的 第 4 版 ， 此 次 新 版 内 容 组 织 更 加 严谨 ， 译 者 更 是 细心 雕琢 ， 保 留 了 这 部 权威 著作 的 原 汁 原味 。 

对 Linux 所 提供 的 功能 全 面 而 准确 的 阐述 ， 以 及 贯穿 全 书 的 示例 程序 体验 ， 使 本 书 不 仅 成 为 初学 者 的 最 佳 
Linux 程 序 设计 指南 ， 而 且 是 中 高 级 程序 员 不 可 或 缺 的 参考 书 。 


Neil Matthew 和 Richard Stones 世界 知名 的 Linux/UNIX 专 家 ， 有 数 十 年 Linux/UNIX 开 发 经 验 和 从 业经 历 。 他 们 使 


用 过 几乎 所 有 UNIX 版 本 ， 并 精通 C/C++、LISP、Fortran、Perl、Tcl 和 Prolog 等 各 种 语言 。 他 们 从 事 过 各 种 软件 项 目 ， 从 
实时 嵌入 式 系统 到 会 计 系统 和 零售 信息 系统 。 除 本 书 外 ， 他 们 还 合 著 过 PostgreSQL、MySQL 方 面 的 图 书 。 
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内 容 提要 


本 书 讲述 了 Linux 系统 及 其 他 UNIX 风格 的 操作 系统 上 的 程序 开发 ， 主 要 内 容 包括 标准 Linux C 语言 函 
数 库 和 由 不 同 的 Linux 或 UNIX 标准 指定 的 各 种 工具 的 使 用 方法 ， 大 多 数 标准 Linux 开发 工具 的 使 用 方法 ， 
通过 DBM 和 MySQL 数据 库 系 统 存储 Linux 中 的 数据 ， 为 X 视窗 系统 建立 图 形 化 用 户 界面 等 。 本 书 通过 先 
介绍 程序 设计 理论 ， 再 以 适当 的 例子 和 清晰 的 解释 来 阐明 它 的 方式 ， 帮 助 读 者 迅速 掌握 相关 的 知识 。 

本 书 适 合 Linux 的 初学 者 及 希望 利用 Linux 进行 开发 的 程序 人 员 阅读 ， 也 适合 作为 高 等 院 校 计算 机 相关 
专业 师 生 的 参考 教材 。 
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所 有 的 计算 机 程序 员 都 会 随手 记 下 大 量 笔记 ， 其 中 的 代码 示例 往往 来 自前 人 对 使 用 手册 的 深入 钻 
研 ， 或 者 来 自 Usenet 新 闻 组 ， 来 自 后 者 的 代码 有 时 连 最 盲目 的 探索 者 也 不 敢 照搬 照抄 当然 也 有 另 一 
种 观点 认为 ,他 们 都 可 以 自由 地 访问 Usenet 新 闻 组 ， 并 且 从 来 没有 停止 过 对 其 中 代码 的 使 用 ), 但 采用 
这 种 风格 的 图 书 可 以 说 少 之 又 少 ， 这 不 能 不 说 是 一 件 很 奇怪 的 事情 。 在 因特网 中 ， 存 在 着 大 量 针对 程 
序 设计 和 系统 管理 特定 领域 的 、 短 小 精 悍 而 又 切中 问题 关键 的 文档 。Linux 文 档 项 目 发 表 了 一 系列 的 
文档 ， 内 容 涵盖 了 Linux 的 各 个 方面 ， 从 在 同一 台 机 器 上 同时 安装 Linux 和 Windows 到 将 你 的 咖啡 机 连 
接 到 Linux 系 统 。 你 可 以 通过 网 址 http://www.tldp.org 来 查看 Linux 文 档 项 目 。 

从 另 一 方面 来 看 ， 现 在 的 图 书市 场 充 斥 着 大 量 这 样 的 图 书 ， 它 们 要 么 是 大 部 头 的 巨著 ， 内 容 详尽 
而 全 面 ， 使 得 你 没有 时 间 把 它们 读 完 ， 要 么 就 是 完全 面向 初学 者 的 入 门 图 书 ， 你 购买 它们 只 是 为 了 送 
给 朋友 〈 开 个 玩笑 而 已 )。 只 有 很 少 的 书籍 尝试 着 对 大 量 实际 应 用 领域 的 基本 概念 和 做 法 进行 介绍 。 
本 书 就 是 其 中 之 一 ， 它 是 对 程序 员 笔 记 的 摘要 ,经 过 破译 〈 要 认 清 程序 员 的 笔迹 可 并 非 易 事 ) 和 编辑 ， 
并 将 它们 有 机 地 组 织 起 来 。 

本 书 这 一 版 经 过 了 审阅 和 更 新 ， 反 映 了 目前 Linux 开 发 的 现状 。 








Alan Cox 
Linux 内 核 维护 者 
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欢迎 阅读 本 书 第 4 版 ， 这 是 一 本 针对 在 Linux 系 统 和 其 他 UNIX 风 格 的 操作 系统 上 进行 程序 开发 的 
易于 使 用 的 指南 性 读物 。 

在 本 书 中 ， 我 们 的 目标 是 介绍 对 于 Linux 程 序 员 来 说 非常 重要 的 主题 ， 这 些 主题 的 涵盖 面 非常 广 
泛 。 书 名 中 的 “beginning” 更 多 的 是 指 书 中 的 内 容 而 不 是 读者 的 技能 。 我 们 对 本 书 的 内 容 组 织 进行 了 
精心 的 安排 ， 以 帮助 读者 更 多 地 了 解 Linux 所 提供 的 功能 ， 而 不 管 读 者 现 有 的 经 验 有 多 少 。Linux 程 序 
设计 是 一 个 很 大 的 领域 ， 我 们 的 目标 是 对 广泛 领域 中 的 大 量 主题 都 进行 介绍 ， 从 而 让 读者 在 每 个 主题 
上 都 具备 足够 的 入 门 知识 。 
读者 对 象 

如 果 你 是 一 位 程序 员 ， 希 望 利 用 Linux (或 UNIX) 提供 给 软件 开发 者 的 工具 来 加 快 程序 开发 的 进 
度 ， 尽 量 减少 编程 时 间 并 让 你 的 程序 充分 利用 Linux 系 统 所 提供 的 功能 ， 那 么 本 书 将 非常 适合 你 。 书 
中 明确 清晰 的 解释 和 分 步骤 的 实验 ， 将 帮助 你 迅速 提高 编程 能 力 和 掌握 所 有 的 关键 技术 。 

我 们 假设 读者 具备 一 些 C 或 C++ 语言 的 编程 经 验 , 这 些 经 验 可 能 来 自 Windows 系 统 或 其 他 一 些 操作 
系统 。 但 我 们 会 尽量 保持 书 中 示例 程序 的 简单 ， 即 便 你 不 是 一 个 C 语 言 编程 专家 ， 也 可 以 轻松 地 阅读 
本 书 。 如 果 存 在 需要 直接 比较 Linux 程 序 设计 和 C/C++ 程序 设计 的 情况 ， 我 们 都 会 在 书 中 指出 。 


如 果 你 刚 开始 学 习 Linux， 请 注意 ， 这 不 是 一 本 介绍 Linux 安 装 和 配置 的 图 书 。 如 果 你 
起 多 学 习 一 些 Linux 系 统管 理 方面 的 知识 ， 请 阅读 其 他 的 参考 书籍 ， 如 Christopher Negus 的 
Linux Bible 2007 Edition Wiley, ISBN 978-0470082799 ). 


本 书 的 目标 是 作为 一 本 教程 ， 向 读者 介绍 大 多 数 Linux 系 统 上 都 有 的 各 种 工具 和 函数 /函数 库 集 ， 
同时 本 书 也 可 以 作为 一 本 方便 使 用 的 参考 手册 。 本 书 的 特点 是 简单 易 懂 、 内 容 广泛 、 示 例 丰富 。 


主要 内 容 


本 书 希 望 让 你 达到 以 下 几 个 学 习 目 标 。 

O 掌握 标准 Linux C 语 言 函 数 库 和 由 各 种 Linux 或 UNIX 标 准 指定 的 其 他 工具 的 使 用 方法 。 

口 掌握 如 何 使 用 大 多 数 标准 Linux 开 发 工具 。 

O 学 会 通过 DBM 和 MySQL 数 据 库 系统 存储 Linux 中 的 数据 。 

O 理解 如 何 为 X 视 窗 系统 建立 图 形 用 户 界面 。 我 们 将 同时 使 用 GTK (GNOME 环 境 的 基础 ) 和 Qt 
(KDE 环 境 的 基础 ) 函数 库 。 

口 拥有 开发 自己 的 实际 应 用 程序 的 信心 和 能 力 。 
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在 讨论 这 些 主题 时 ， 我 们 首先 介绍 编程 理论 ， 然 后 通过 适当 的 例子 和 清晰 的 解释 来 阐明 它 。 通 过 
这 种 方式 ， 你 可 以 在 第 一 遍 的 学 习 中 就 能 够 迅速 掌握 相关 知识 。 如 有 必要 ， 你 还 可 以 回顾 这 些 内 容 以 
重 温 所 有 的 基本 要 素 。 

书 中 小 示例 程序 主要 是 为 了 演示 一 组 函数 的 用 法 或 某 些 新 概念 的 实际 使 用 情况 。 贯 穿 全 书 有 一个 
大 型 的 示例 项 目 ， 一 个 简单 的 用 于 记录 音乐 CD 详细 资料 的 数据 库 应 用 程序 。 随 着 知识 面 的 扩展 ， 你 
可 以 按照 自己 的 意愿 开发 、 重 新 实现 和 扩展 这 个 项 目 。 虽然 如 此 ， 这 个 CD 应 用 程序 对 本 书 的 任何 一 
章 来 说 都 不 是 必需 的 ， 所 以 只 要 你 愿意 也 可 以 忽略 它 ， 但 我 们 认为 它 对 书 中 讨论 的 技术 提供 了 一 些 有 
用 的 和 深入 的 示范 ， 并 且 它 还 有 助 于 讲解 每 个 高 级 主题 。 我 们 对 这 个 应 用 程序 的 第 一 次 讨论 出 现在 本 
书 第 2 章 的 结尾 处 , 它 显示 了 一 个 非常 大 的 shell 脚 本 是 如 何 组 织 的 ，shell 如 何 处 理 用 户 输入 、 如 何 构造 
菜单 以 及 如 何 存储 和 检索 数据 。 

在 简要 介绍 完 编译 程序 、 链 接 函数 库 和 访问 在 线 手册 的 基本 概念 后 ， 将 全 面 介绍 shell 编 程 。 然 后 
你 将 投入 到 C 语 言 程序 设计 中 ， 我 们 在 这 里 讨论 的 内 容 包括 文件 操作 、 从 Linux 环 境 中 获取 信息 、 处 理 
终端 的 输入 输出 和 curses 函 数 库 ( 它 使 得 交互 式 的 输入 和 输出 更 易于 管理 )。 最 后 你 将 用 Ci 重新 
实现 CD 应 用 程序 。 应 用 程序 的 设计 方法 没有 变化 ， 但 新 的 代码 中 将 用 curses 函 数 库 提 供 一 个 基于 屏 
幕 的 用 户 界面 。 

接 下 来 我 们 讨论 数据 管理 。 为 了 学 习 abm 数 据 库 函数 库 的 使 用 方法 ， 我 们 将 再 次 重新 实现 这 个 应 
用 程序 ， 但 这 次 实现 所 采用 的 设计 方法 将 贯穿 本 书后 续 的 一 些 章节 。 在 其 后 的 一 章 中 ， 我 们 将 介绍 数 
据 是 如 何 使 用 MySQL 存 储 在 一 个 关系 数据 库 中 的 , 并 且 我 们 还 将 在 该 章 的 稍 后 部 分 重新 使 用 这 种 数据 
存储 技术 ， 以 便 读 者 了 解 两 种 技术 的 区 别 。 随 着 这 些 应 用 程序 的 规模 越 来 越 大 ， 我 们 接 下 来 需要 介绍 
调试 、 源 代码 控制 、 软 件 发 行 和 makefile 文 件 等 具体 内 容 。 

接 下 来 ， 你 将 看 到 不 同 的 Linux 进 程 是 如 何 使 用 各 种 技术 进行 通信 的 ， 以 及 Linux 程 序 是 如 何 使 用 
套 接 字 来 支持 不 同 机 器 之 间 的 TCP/IP 网 络 通信 的 ， 包括 与 使 用 不 同 处 理 器 架构 的 机 器 之 间 通信 的 问题 。 

在 掌握 了 Linux 程 序 设计 的 基础 之 后 ， 我 们 开始 讨论 图 形 化 程序 的 创建 方法 。 我 们 将 通过 两 章 的 
篇 幅 来 介绍 相关 内 容 。 首 先 介绍 GTK+ 工 具 包 ， 它 是 GNOME 开 发 环境 的 基础 ; 然后 介绍 Qt 工具 包 ， 它 
是 KDE 开 发 环境 的 基础 。 

在 本 书 的 最 后 一 章 ， 我 们 简要 介绍 了 Linux 的 标准 ， 正 是 这 些 标准 使 得 不 同 厂商 的 Linux 发 行 版 保 
持 了 足够 的 相似 性 ， 从 而 使 我 们 编写 的 程序 可 以 在 不 同 的 Linux 发 行 版 上 运行 。 

正如 你 所 期 望 的 ， 本 书 还 包括 许多 其 他 内 容 ， 但 我 们 希望 这 里 给 出 的 简单 介绍 能 够 让 你 对 将 讨论 
的 内 容 有 一 个 清晰 的 概念 。 


准备 工作 


在 本 书 中 ， 我 们 将 给 予 读者 一 种 Linux 程 序 设计 的 体验 。 为 了 更 好 地 理解 各 章 的 内 容 ， 你 应 该 在 
阅读 本 书 时 ， 实 际 运行 书 中 的 程序 示例 。 这 将 提供 一 个 很 好 的 编程 实践 体验 ， 并 将 启发 你 创建 自己 的 
程序 。 我 们 希望 读者 一 边 阅读 一 边 在 Linux 系 统 上 实际 操作 。 

Linux 可 以 用 在 许多 不 同 的 系统 上 。 其 适应 性 使 得 只 要 设备 中 有 一 个 处 理 器 芯片 ，Linux 就 可 以 以 
这 样 或 那样 的 方式 在 其 上 运行 。 可 以 运行 Linux 系 统 的 设备 包括 基于 Alpha、 ARM、 IBM Cell, Itanium, 
PA-RISC、PowerPC、SPARC、SuperH、68k 以 及 各 种 x86 系 列 处 理 器 (32 位 和 64 位 ) 的 计算 机 。 

我 们 使 用 两 台 不 同 配置 的 Linux 系 统 来 编写 本 书 并 开发 书 中 的 程序 示例 ， 所 以 我 们 可 以 确信 ， 只 
要 你 的 机 器 可 以 运行 Linux， 你 就 可 以 很 好 的 利用 本 书 。 此 外 ， 在 本 书 的 技术 审核 阶段 ， 我 们 还 在 其 
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他 版 本 的 Linux 系 统 中 测试 了 书 中 的 全 部 代码 。 

我 们 在 编写 本 书 时 主要 使 用 的 是 基于 x86 的 系统 ， 但 我 们 所 讨论 的 内 容 很 少 是 只 适用 于 x86 的 。 虽 
然 在 一 台 有 8 MB 内 存 的 486 机 器 上 运行 Linux 也 是 可 能 的 ， 但 要 想 成 功 地 运行 一 个 现代 Linux 发 行 版 并 
运行 本 书 中 的 程序 示例 ， 我 们 建议 你 使 用 Fedora、 openSUSE 或 Ubuntu 等 比较 流行 的 Linux 发 行 版 的 最 
新 版 本 ， 并 采用 它们 所 推荐 的 硬件 配置 。 

在 软件 需求 方面 ， 我 们 建议 使 用 你 偏爱 的 Linux 发 行 版 的 最 新 版 本 ， 并 应 用 当前 更 新 〔 大 多 数 厂 
商会 通过 自动 更 新 的 方式 在 线 提供 这 些 更 新 ) 以 保证 你 的 系统 打上 了 所 有 的 补丁 。 Linux 和 GNU 工 具 
集 都 是 以 GNU 通 用 公共 许可 证 (GPL) 的 形式 发 布 的 。 一 个 典型 的 Linux 发 行 版 的 大 多 数 其 他 组 件 也 
都 使 用 GPL 许可 证 或 其 他 开放 源码 许可 证 之 一 ， 这 意味 着 它们 都 具有 某 些 特性 ， 其 中 之 一 就 是 自由 。 
它们 的 源 代码 总 是 可 以 被 自由 获取 ， 没 有 人 可 以 剥夺 这 种 自由 。 关于 GPL 的 详细 资料 请 见 http:/ 
www.gnu.org/licenses/。 关 于 开放 源码 定义 和 它 所 使 用 的 各 种 许可 证 的 详细 资料 请 见 http://www,open- 
source.org/。 你 总 是 可 以 获取 到 对 GNU/Linux 的 支持 一 一 你 可 以 自己 研究 源 代 码 、 雇用 他 人 或 购买 厂商 
的 付费 支持 。 


源 代码 


当 试验 本 书 中 的 程序 示例 时 , 你 可 以 手工 输入 所 有 的 代码 , 也 可 以 使 用 和 本 书 配套 的 源 代码 文件 。 
本 书 使 用 的 所 有 程序 源 代码 都 可 以 从 http://www.wrox.com 上 下 载 。 在 该 网 站 中 ， 你 只 需 找 到 本 书 所 在 
页 面 (通过 搜索 框 或 使 用 书 名 列表 )， 然 后 在 本 书 内 容 介绍 页 面 点 击 Download Code € 下 载 代码 ) 链 
接 ， 就 可 以 获得 本 书 的 所 有 源 代 码 了 。 

因为 很 多 图 书 都 有 类 似 的 书 名 ， 所 以 通过 ISBN 搜 索 图 书 是 最 佳 的 方式 ， 本 书 的 ISBN 为 

978-0-470-14762-7. 

在 下 载 了 源 代码 之 后 ， 你 就 可 以 用 压缩 工具 对 其 解压 。 此 外 ， 你 也 可 以 访问 Wrox 代 码 下 载 主页 
《http;//www.wrox.com/dynamic/books/download.aspx )， 获 取 本 书 和 其 他 Wrox 图 书 的 源 代码 。 


代码 下 载 说 明 


我 们 尽力 向 读者 提供 能 够 清晰 闻 明 书 中 所 讨论 概念 的 示例 程序 和 代码 片段 。 需 要 指出 的 是 ， 为 了 
尽 可 能 地 解释 清楚 书 中 介绍 的 新 功能 ， 我 们 将 采用 一 种 或 两 种 代码 风格 。 

特别 要 指出 的 是 ， 我 们 并 没有 对 调用 的 每 个 函数 的 返回 值 进行 检查 ， 以 判断 它 是 否 与 我 们 预期 的 
一 样 。 在 真正 的 应 用 程序 代码 中 ， 我 们 肯定 要 做 这 样 的 检查 工作 ， 而 读者 也 应 该 对 错误 处 理 采 取 严 格 
的 措施 。( 本 书 的 第 3 章 将 讨论 一 些 捕获 和 处 理 错误 的 方法 。) 


GUN 通用 公共 许可 证 
书 中 的 所 有 源 代码 都 遵循 GNU 通 用 公共 许可 证 第 二 版 Chttp://www.gnu.org/ licenses/old-licenses/ 
gpl-2.0.html) 的 条 款 。 下 面 的 许可 说 明 适 用 于 本 书 所 有 的 源 代码 ; 


This program is free software; you can redistribute it and/or modify 
it under the terms of the GNU General Public License as published by 
the Free Software Foundation; either version 2 of the License, or 
(at your option) any later version. 











tty2 


This program is distributed in the hope that it will be useful, 
but WITHOUT ANY WARRANTY; without even the implied warranty of 
MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the 
GNU General Public License for more details. 
You should have received a copy of the GNU General Public License 
along with this program; if not, write to the Free Software 
Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307 USA 
为 了 帮助 读者 更 好 地 理解 本 书 内 容 ， 随 时 把 握 学 习 重点 ， 全 书 将 使 用 以 下 一 些 排版 约定 ， 
们 与 周边 的 内 容 直 接 相 关 -。 
合 键 的 格式 为 ，Ctrl+A。 
$ who 
root 
rick 


我 们 使 用 3 种 不 同 的 方式 来 印刷 代码 和 终端 会 话 : 


Sep 10 16:12 





书 中 像 这 样 的 文字 框 中 记录 的 是 一 些 重要 的 、 不 应 该 被 忘记 的 、 非 常 关键 的 信息 。 它 


Sep 10 16:10 








对 当前 讨论 内 容 的 技巧 、 提 示 、 穿 门 和 雳 白 都 会 像 这 样 编 进 放置 并 将 字体 设置 为 楷体 。 
ttyl 


#include <stdio.h> 


对 于 命令 行 ， 它 的 样式 如 上 面 代码 的 顶部 所 示 ， 而 它 的 输出 结果 则 以 常规 风格 印刷 。 字 符 $ 是 提 
示 符 〈 如 果 命令 需要 超级 用 户 来 执行 ， 则 提示 符 会 用 





当 我 们 进行 介绍 时 ， 我 们 将 把 一 些 重要 的 单词 用 槽 体 印刷 ， 需 要 读者 输入 的 字符 用 粗 体 印刷 。 组 


出 。 在 上 面 的 例子 中 ， 你 输入 命令 who， 然 后 将 在 命令 下 面 看 到 输出 的 结果 。 
Linux 定 义 的 函数 和 结构 的 原型 使 用 黑体 字 来 印刷 ， 如 下 所 示 : 

int printf (const char *format, 

/* 这 样 印刷 的 是 新 的 、 重 要 的 代码 ，*/ 


命令 ,然后 按 下 回 车 键 执行 该 命令 。 其 后 采用 相同 字体 但 不 是 黑体 的 所 有 文本 都 是 该 黑体 字 命 令 的 输 


符 # 来 蔡 代 )， 粗 体 字 的 文本 是 需要 读者 输入 的 
2 
[IARE */ 


/* 这 样 印刷 的 是 以 前 出 现 过 的 代码 。*/ 


在 我 们 的 代码 示例 中 ， 带 有 底 纹 的 部 分 是 新 的 、 重 要 的 内 容 ， 如 下 所 示 : 
/* 到 此 结束 */ 


不 再 加 底 纹 了 。 例 如 ， 一 个 新 的 程序 如 下 所 示 : 
[t 代码 示例 */ 


而 如 时代 码 采用 的 是 如 下 所 示 不 带 底 纹 的 风格 ， 就 表示 它 的 内 容 没有 那么 重要 : 
/* 到 此 结束 */ 


当 程序 代码 的 内 容 在 一 章 中 有 增加 时 ， 后 来 添加 的 代码 首次 出 现时 以 加 底 纹 的 风格 给 出 ， 其 后 就 
/* 这 一 行 和 下 一 行 */ 
7/* 是 新 增 的 代码 */ 


如 果 我 们 在 该 章 的 稍 后 部 分 增加 了 这 个 程序 的 内 容 ， 新 增 代码 将 带 有 底 纹 : 
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我 们 要 提 到 的 最 后 一 个 约定 是 ， 我 们 在 每 个 程序 示例 开始 之 前 都 会 加 上 一 个 “实验 ”标题 ， 其 目 
的 是 为 了 将 代码 分 隔 开 , 突出 显示 其 组 成 部 分 , 同时 可 以 显示 应 用 程序 的 进度 。 当 我 们 觉得 有 必要 时 ， 
还 会 在 代码 之 后 加 上 “实验 解析 ”部 分 ， 来 解释 代码 中 与 前 面 理论 有 关 的 关键 之 处 。 我 们 发 现 这 两 个 
约定 有 助 于 把 非常 难于 理解 的 代码 清单 分 解 为 相对 简单 的 部 分 。 
勘误 表 

我 们 已 经 尽力 保证 本 书 的 文字 和 程序 代码 没有 任何 错误 。 但 是 人 无 完 人 ， 错 误 总 是 难免 的 。 如 果 
你 找到 了 本 书 中 的 错误 ， 比 如 拼写 错误 或 代码 错误 ， 我 们 将 非常 感谢 可 以 得 到 你 的 反馈 。 指 正 错误 不 
仅 可 以 为 其 他 读者 节省 时 间 ， 同 时 也 可 以 帮助 我 们 提高 图 书 的 品质 。 

要 找到 本 书 的 勘误 表 ， 请 访问 http://www.wrox.com， 然 后 使 用 搜索 框 或 书 名 列表 来 找到 本 书 。 在 
本 书 的 页 面 ， 点 击 Book Errata (图书 勘误 表 ) 链接 。 在 该 链接 指向 的 页 面 中 ， 你 可 以 看 到 由 Wrox 编 辑 
发 布 的 所 有 针对 本 书 提交 的 勘误 。 你 也 可 以 通过 网 址 http://www.wrox.com/misc-pages/booklist.shtml 找 
到 一 个 完整 的 图 书 列表 ， 其 中 包括 指向 每 本 书 勘误 表 的 链接 。 

如 果 在 本 书 的 勘误 表 中 没有 找到 你 发 现 的 错误 ， 可 以 访问 网 址 http://www.wrox.comycontact/ 
techsupport.shtml, 填写 该 页 面 上 的 表格 以 将 你 发 现 的 错误 发 送 给 我 们 ,我 们 将 检查 你 发 送 过 来 的 信息 ， 
如 果 它 是 正确 的 ， 我 们 将 在 本 书 的 勘误 表 中 发 布 该 信息 ， 并 在 本 书 的 下 一 版 中 修正 该 问题 。 


p2p.wrox.com 


为 参与 作者 和 同行 的 讨论 ， 你 可 以 加 入 P2P 论 坛 ， 它 的 网 址 是 p2p.wrox.com。 这 个 论坛 是 一 个 基 
于 Web 的 系统 , 你 可 以 在 其 上 发 布 与 Wrox 图 书 和 相关 技术 有 关 的 消息 , 并 与 其 他 读者 和 技术 用 户 交流 。 
这 个 论坛 还 提供 了 订阅 功能 , 当 有 你 感 兴趣 的 主题 发 布 时 , 论坛 会 通过 电子 邮件 把 这 些 消息 发 送 给 你 。 
Wrox 的 作者 、 编 辑 、 其 他 行业 专家 和 与 你 一 样 的 读者 都 会 到 这 个 论坛 探讨 一 些 问题 。 

在 http://p2p.wrox.com 中 ， 你 将 找到 很 多 不 同 的 论坛 ， 这 些 论坛 不 仅 有 助 于 你 阅读 本 书 ,而且 也 有 
助 于 你 开发 自己 的 应 用 程序 。 要 加 入 这 些 论坛 ， 你 只 需 按 如 下 步骤 操作 即 可 。 

(1) 访问 p2p.wrox.com 并 点 击 Register 链 接 。 

(2) 阅读 使 用 条 款 并 点 击 Agree 按 钮 。 

(3) 填写 加 入 论坛 所 必需 的 信息 和 你 想 要 提供 的 其 他 可 选 信 息 ， 然 后 点 击 Submit 按 钮 。 

(4) 你 将 收 到 一 封 电子 邮件 ， 该 邮件 告诉 你 如 何 验 证 你 的 账号 并 完成 加 入 程序 。 

注意 ， 不 加 入 P2P 论 坛 也 可 以 阅读 论坛 中 的 消息 ， 但 是 如 果 你 想 要 发 布 自 己 的 消息 ， 你 

就 必须 加 入 论坛 。 

加 入 论坛 后 ， 你 就 可 以 发 布 新 消息 并 回复 其 他 用 户 发 布 的 消息 了 。 你 可 以 在 任何 时 间 阅 读 Web 站 
点 上 的 消息 。 如 果 希 望 某 个 论坛 能 将 最 新 的 消息 通过 电子 邮件 发 送 给 你 ， 你 可 以 点 击 论坛 列表 中 该 论 
坛 名 称 旁 边 的 Subscribe to this Forum 图 标 。 

要 获得 如 何 使 用 Wrox P2P 的 更 多 信息 ， 你 可 以 阅读 P2P FAQ 列 表 中 的 问题 及 其 答复 ， 这 些 问题 与 
论坛 软件 的 工作 原理 及 很 多 与 P2P 和 Wrox 图 书 相关 的 常见 问题 有 关 。 要 阅读 FAQ, 你 可 以 点 击 任何 P2P 
页 面 上 的 FAQ 链 接 。 
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YEA 你 将 发 现 Linux 是 什么 ， 以 及 它 与 它 的 灵感 之 源 一 一 UNIX 有 何 关系 。 我 们 将 带领 
十 你 了 解 Linux 开 发 系统 提供 了 哪些 机 制 ， 并 且 编 写 和 运行 你 的 第 一 个 程序 。 在 本 章 中 ， 我 们 
将 介绍 以 下 几 方 面 的 内 容 : 

口 UNIX、Linux 和 GNU 

口 Linux 程 序 及 其 编程 语言 

口 如 何 寻 找 开发 资源 

口 静态 库 和 共享 库 

口 UNIX 哲 学 


1.1 UNIX、Linux 和 GNU 简介 


近年 来 ，Linux 已 成 为 一 种 现象 。 几 乎 每 天 ，Linux 都 以 某 种 方式 出 现在 媒体 上 。 我 们 已 经 数 不 清 
在 Linux 上 有 多 少 应 用 程序 以 及 有 多 少 机 构 〈 包 括 一 些 政府 部 门 和 城市 管理 部 门 ) 在 使 用 Linux 了 。 主 
要 的 硬件 厂商 (如 IBM 和 Dell) 现在 都 已 支持 Linux， 主 要 的 软件 厂商 〈 如 Oracle) 也 都 已 支持 他 们 的 
软件 运行 在 Linux 之 上 。Linux 已 真正 成 为 一 个 切实 可 行 的 操作 系统 ， 特 别 是 在 服务 器 市 场 中 。 

Linux 的 成 功 要 归功 于 在 它 之 前 诞生 的 系统 和 应 用 程序 一 一 UNIX 和 GNU 软 件 。 本 节 将 介绍 Linux 
是 怎样 产生 的 ， 以 及 它 植 根 于 何 处 。 


1.1.1 什么 是 UNIX 


UNIX 操 作 系统 最 初 是 由 贝尔 实验 室 开 发 的 ， 当 时 的 贝尔 实验 室 是 电信 业 巨 头 AT&T《〈 美 国电 报 
电话 公司 ) 旗下 的 一 员 。UNIX 是 在 20 世 纪 70 年 代为 DEC (数字 设备 公司 ) 的 PDP 系 列 计算 机 设计 的 ， 
它 现 在 已 成 为 一 种 非常 流行 的 多 用 户 、 多 任务 操作 系统 。UNIX 操 作 系统 可 以 运行 在 大 量 不 同 种 类 
的 硬件 平台 上 ， 其 适用 范围 从 PC 工作 站 一 直到 多 处 理 器 服务 器 和 超级 计算 机 。 

1. UNIX 简 史 

严格 来 说 ，UNIX 是 由 Open Group 〈 开 放 组 织 ) 管理 的 一 个 商标 ， 它 指 的 是 一 种 遵循 特定 规范 的 
计算 机 操作 系统 。 这 个 规范 也 称 为 单一 UNIX 规 范 〈The Single UNIX Specification)， 它 定义 了 所 有 必 
需 的 UNIX 操 作 系统 函数 的 名 称 、 接 口 和 行为 。 这 个 规范 在 很 大 程度 上 是 早期 由 IEEE (电气 和 电子 工 
程 师 协 会 ) 开发 的 P1003 或 POSIX 规 范 的 超 集 。 

许多 类 UNIX 系 统 都 是 具有 商业 性 质 的 ， 如 IBM 的 AIX、HP 的 HP-UX 和 Sun 的 Solaris。 还 有 一 些 可 
以 免费 获得 ， 如 FreeBSD 和 Linux。 如 今 只 有 少数 系统 完全 遵守 开放 组 织 的 规范 ， 从 而 允许 它们 挂 上 
“UNIX” 的 商标 。 
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在 过 去 ， 不 同 UNIX 系 统 之 间 的 兼容 性 一 直 是 一 个 实际 存在 的 问题 ， 尽 管 POSIX 规 范 在 这 一 方面 
起 了 很 大 的 帮助 。 现 在 ， 通 过 遵守 一 些 简单 的 规则 ， 创 建 可 以 运行 在 所 有 UNIX 和 类 UNIX 系 统 上 的 应 
用 程序 已 成 为 可 能 。 关 于 Linux 和 UNIX 标 准 的 更 多 细节 内 容 可 以 在 本 书 的 第 18 章 中 找到 。 
2. UNIX 哲 学 
在 后 续 的 章节 里 ， 我 们 希望 能 够 向 读者 传达 一 种 Linux (UNIX) 程序 设计 的 风格 。 虽 然 不 管 在 哪 
种 平台 上 用 C 语 言 编程 在 很 多 方面 都 是 一 样 的， 但 UNIX 和 Linux 开 发 者 对 编程 和 系统 开发 确实 有 其 独 
特 的 观点 。 
UNIX 操 作 系统 〈 包 括 Linux) 鼓励 一 种 特定 的 编程 风格 。 下 面 列 出 了 一 些 典 型 的 UNIX 程 序 和 系 
统 所 具有 的 特点 。 
口 简单 性 ， 许 多 很 有 用 的 UNIX 工 具 是 非常 简单 的 ， 因 此 也 是 很 小 并 易于 理解 的 。“ 小 而 简单 ” 
(KISS: Keep It Small and Simple) 是 一 种 值得 学 习 的 技术 。 越 大 、 越 复杂 的 系统 注定 包含 越 大 、 
越 复杂 的 错误 ， 而 调试 是 我 们 所 有 人 都 想 避 免 的 苦 差事 。 
O 集中 性 : 通常 ， 让 一 个 程序 很 好 地 执行 一 项 任务 要 好 过 把 所 有 功能 都 乱 七 八 精 地 堆 在 一 起 。 功 
TE BEP QU FE E FAE AIE, 只 有 单一 目标 的 程序 更 容易 随 着 更 好 的 算法 或 界面 被 开发 出 来 
而 得 到 改进 。 在 UNIX 中 ， 当 用 户 出 现 新 的 需求 时 ， 我 们 通常 是 把 小 工具 组 合 起 来 以 完成 更 复 
杂 的 任务 ， 而 不 是 试图 将 一 个 用 户 期 望 的 所 有 功能 放 在 一 个 大 程序 里 。 
口 可 重用 组 件 : 将 应 用 程序 的 核心 实现 为 库 。 具 有 简单 而 灵活 的 编程 接口 、 文 档 齐备 的 库 可 以 帮 
助 其 他 人 开发 出 同类 程序 ， 或 者 把 这 些 技术 应 用 到 新 的 应 用 领域 。abm 库 就 是 一 个 例子 ， 它 是 
-组 可 重用 的 函数 ， 而 不 是 单一 的 数据 库 管 理 程序 。 
口 过 滤器 :许多 UNIX 应 用 程序 可 用 作 过 滤器 。 也 就 是 说 ， 它 们 对 输入 进行 转换 并 产生 输出 。 正 
如 你 将 在 后 面 看 到 的 ，UNIX 提 供 了 一 些 机 制 ， 让 我 们 可 以 把 一 些 UNIX 程 序 通过 一 种 新 颖 的 方 
式 组 合 起 来 ， 以 开发 出 相当 复杂 的 应 用 程序 。 当然， 这 种 类 型 的 重用 是 靠 我 们 前 面 提 到 的 开发 
方法 支撑 的 。 
O 开放 的 文件 格式 :比较 成 功 并 流行 的 UNIX 程 序 都 使 用 纯 ASCII 码 的 文本 文件 或 XML 文件 作为 
配置 文件 和 数据 文件 。 如 果 你 在 开发 程序 时 采用 了 任 一 种 做 法 ， 那 你 做 对 了 ! 它 使 用 户 可 以 用 
标准 工具 来 修改 和 搜索 配置 项 ， 并 且 可 以 开发 出 新 工具 在 数据 文件 上 执行 新 的 功能 。ctags 源 
代码 交叉 引用 系统 就 是 一 个 好 例子 ， 它 把 符号 位 置信 息 以 适合 于 搜索 程序 使 用 的 正则 表达 式 的 
形式 记录 下 来 。 
口 灵活 性 : 你 不 能 期 待 用 户 都 能 非常 正确 地 使 用 你 的 程序 。 所 以 ， 你 在 编程 时 应 尽量 考虑 到 灵活 
性 ， 尽 量 避 免 随意 限制 字段 长 度 或 记录 数目 。 如 果 你 能 做 到 的 话 ， 则 你 编写 的 网 络 程序 既 能 在 
单机 上 运行 ， 也 能 跨 网 络 运行 。 永 远 不 要 认为 你 知道 用 户 想 做 的 一 切 事 。 


1.1.2 什么 是 Linux 


可 能 你 已 经 知道 , Linux 是 一 个 可 以 自由 发 布 的 类 UNIX 内 核实 现 , 它 是 一 个 操作 系统 的 底层 核心 。 
因为 Linux 以 UNIX 系 统 为 其 灵感 来 源 ， 所 以 Linux 程 序 和 UNIX 程 序 是 非常 相似 的 。 事 实 上 ， 几 乎 所 有 
为 UNIX 编 写 的 程序 都 可 以 在 Linux 上 编译 运行 。 而 且 ， 一 些 专用 于 UNIX 商 业 版 本 的 商业 应 用 软件 ， 
也 可 以 不 加 改变 地 以 二 进 制 形式 运行 在 Linux 系 统 上 。 

Linux 是 由 赫尔辛基 大 学 的 Linus Torvalds 开 发 的 ， 期 间 得 到 了 因特网 上 广大 UNIX 程 序 员 的 帮助 。 
它 最 初 只 是 受 Andy Tanenbaum 教 授 的 Minix (一 个 小 型 的 类 UNIX 系 统 ) 启发 而 开发 的 程序 ， 纯 属 个 人 
爱好 ， 但 后 来 它 自身 逐步 发 展 成 为 一 个 完整 的 系统 。 其 开发 目的 是 保证 Linux 除 包含 可 以 自由 发 布 的 
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代码 外 ， 不 会 集成 任何 专 有 代码 。 

现在 ， 使 用 不 同类 型 CPU 的 计算 机 系统 都 有 Linux 的 版 本 可 以 运行 其 上 , 包括 基于 32 位 和 64 位 Intel 
x86 及 其 兼容 处 理 器 的 个 人 计算 机 、 使 用 SUN SPARC, IBM PowerPC. AMD Opteron, Intel Itanium 的 
工作 站 和 服务 器 ， 甚 至 一 些 手 持 PDA 和 Sony PS2/PS3 游 戏 机 。 只 要 这 个 设备 有 处 理 器 ， 就 会 有 人 试图 
让 Linux 运 行 其 上 。 
1.13 GNU 项 目 和 自由 软件 基金 会 


Linux 能 够 存在 并 发 展 到 今天 是 无 数 人 共同 努力 的 结果 。 操 作 系 统 内 核 本 身 仅仅 是 可 用 开发 系统 
的 一 小 部 分 。 传 统 上 ， 商业 化 的 UNIX 系 统 都 包含 提供 系统 服务 和 工具 的 应 用 程序 。 对 Linux 系 统 来 说 ， 
这 些 额外 的 程序 是 由 许多 程序 员 编 写 并 自由 发 布 的 。 

Linux 社 区 以 及 其 他 的 软件 开发 组 织 ) 支持 自由 软件 的 概念 ， 即 软件 本 身 不 应 受 限 ， 它 们 应 遵 
守 GNU (GNU 是 GNU's Not UNIX 的 递归 缩写 ) 通用 公共 许可 证 GPL)。 虽 然 获得 软件 可 能 要 支付 一 
定 的 费用 ， 但 此 后 就 可 以 随意 使 用 它们 ， 并 且 它 们 通常 是 以 源 代码 的 形式 发 布 。 

自由 软件 基金 会 (Free Software Foundation) 由 Richard Stallman 创 立 ， 他 是 UNIX 及 其 他 系统 上 最 
著名 的 文本 编辑 软件 之 一 GNU Emacs 的 开发 者 。Stallman 是 自由 软件 这 一 概念 的 倡导 者 ， 并 发 起 了 
GNU 项 目 ， 这 个 项 目的 宗旨 是 : 试图 创建 一 个 与 UNIX 系 统 兼容 ,但 并 不 受 UNIX 名 字 和 源 代 码 私有 权 
限制 的 操作 系统 和 开发 环境 。 可 能 有 一 天 ， GNU 处 理 硬件 和 管理 运行 程序 的 方式 会 变 得 与 UNIX 完 全 
不 同 ， 但 它 仍然 会 继续 支持 UNIX 类 型 的 应 用 程序 。 

GNU 项 目 己 为 软件 社区 提供 了 许多 UNIX 系 统 上 应 用 程序 的 仿制 品 。 所 有 这 些 程序 , 即 GNU 软 件 ， 
都 是 在 GNU 通 用 公共 许可 证 (GPL) 的 条 款 下 发 布 的 。 你 可 以 在 http://www.gnu.org 上 找到 该 许可 证 的 
- 份 副本 。 这 份 许可 证 阐述 了 copyleft (copyleft 是 一 个 生 造 的 词 ， 是 英文 copyright 的 反 话 ) 的 概念 。 

copyleft 的 目的 是 防止 有 人 给 自由 软件 的 使 用 加 上 限制 。 

下 面 是 在 GPL 条 款 下 发 布 的 一 些 主要 的 GNU 项 目 软件 。 

口 GCC: GNU 编 译 器 集 ， 它 包括 GNU C 编 译 器 。 

口 GH+，C++ 编 译 器 ， 是 GCC 的 一 部 分 。 

O GDB: 源 代码 级 的 调试 器 。 

O GNU make: UNIX make 命 令 的 免费 版 本 。 

O Bison: 与 UNIX yacc 兼 容 的 语法 分 析 程 序 生成 器 。 

O bash: 命令 解释 器 shell)。 

O GNU Emacs: 文本 编辑 器 及 环境 。 

许多 其 他 的 软件 包 也 是 在 遵守 自由 软件 的 原则 和 GPL 条 款 的 情况 下 开发 和 发 行 的 ， 包括 电子 表 
格 、 源 代码 控制 工具 、 编 译 器 和 解释 器 、 因 特 网 工具 、 图 形 图 像 处 理工 具 (如 Gimp)， 以 及 两 个 完整 
的 基于 对 象 的 环境 《GNOME 和 KDE)。 我 们 将 在 第 16 章 和 第 17 章 讨论 GNOME 和 KDE。 

现在 有 这 么 多 可 用 的 自由 软件 , 再 加 上 Linux 内 核 , 我 们 可 以 说 : 创建 一 个 GNU 的 、 自 由 的 类 UNIX 
系统 的 目标 已 经 通过 Linux 系 统 实现 了 。 由 于 认识 到 GNU 软 件 所 做 出 的 贡献 ， 现 在 许多 人 通常 都 把 
Linux 系 统称 为 GNU/Linux。 

你 可 以 在 http://www.gnu.org 上 找到 更 多 关于 自 由 软件 的 概念 。 


1.1.4. Linux 发 行 版 
正如 我 们 前 面 提 到 的 ，Linux 实 际 上 只 是 一 个 内 核 。 你 可 以 获得 内 核 源 代码 ， 编 译 并 安装 它 ， 然 
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后 获得 并 安装 许多 其 他 自由 发 布 的 软件 ， 从 而 完成 一 个 完整 Linux 系 统 的 安装 。 我 们 通常 将 这 样 安装 
所 得 的 系统 称 为 Linux 系 统 ， 这 是 因为 它 包 含 的 远 不 止 一 个 Linux 内 核 。 系 统 中 大 多 数 的 工具 都 来 自 于 
自由 软件 基金 会 的 GNU 项 目 。 

你 可 能 会 意识 到 ， 仅 从 源 代码 开始 创建 Linux 系 统 是 一 件 很 不 容易 的 事 。 幸 运 的 是 ， 许 多 人 制作 
了 准备 好 安装 的 Linux 发 行 版 (通常 称 为 flavor), 它 一 般 可 下 载 或 以 CD-ROM/DVD 为 载体 。 它 不 仅 包 
含 内 核 ， 还 包含 许多 其 他 编程 工具 和 应 用 程序 。 它 通常 都 会 包含 一 个 X 视 窗 系统 的 实现 ， 即 在 许多 
UNIX 系 统 上 都 有 的 一 个 图 形 化 环境 。Linux 发 行 版 通常 还 带 有 安装 程序 和 附加 文档 (这 些 一 般 也 都 
在 CD 上 )， 帮 助 你 安装 自己 的 Linux 系 统 。 一 些 著名 的 Linux 发 行 版 (特别 是 在 Intel x86 系 列 处 理 器 上 
的 发 行 版 )》 有 Red Hat Enterprise Linux 及 其 社区 开发 版 的 Fedora、Novell SuSE Linux 及 其 免费 的 
openSUSE 变 体 、Ubuntu Linux、Slackware、Gentoo 和 Debian GNU/Linux， 更 多 Linux 发 行 版 的 详细 信 
息 可 访问 DistroWatch 网 站 http://distrowatch.com。 


1.2 Linux 程序 设计 


许多 人 认为 Linux 程 序 设计 就 是 用 C 语 言 编程 。 的 确 ，UNIX 最 初 是 用 C 语 言 编写 的 ， 并 且 UNIX 的 
大 多 数 应 用 程序 也 是 用 C 语 言 编 写 的 , 但 C 语 言 并 不 是 Linux 程 序 员 或 UNIX 程 序 员 的 唯一 选择 。 在 本 书 
中 ， 我 们 将 介绍 几 种 其 他 的 选择 。 


事实 上 ，UNIX 的 第 一 个 版 本 是 在 1969 年 用 PDP 7 机 器 的 汇编 语言 编写 的 .差不多 也 在 
那个 时 候 ，Dennis Ritchie 发 明了 C 语 言 ， 并 于 1973 年 与 Ken Thompson 一 起 用 Ci 语言 重 写 了 
整个 UNIX 内 核 ， 这 在 那个 连 系 统 软件 都 是 用 汇编 语言 编写 的 时 代 的 确 是 个 了 不 起 的 壮举 。 
对 Linux 系 统 来 说 ,， 有 各 种 各 样 的 编程 语言 可 供 选用 ,其 中 许多 是 免费 的 , 它们 可 以 通过 CD-ROM 
光盘 获得 或 在 因特网 上 通过 FTP 站 点 下 载 。 表 1-1 列 出 了 Linux 程 序 员 可 用 的 部 分 编程 语言 。 
表 1-1 











Ada [3 Ce 

Eiffel Forth Fortran 

Icon Java JavaScript. 
Lisp Modula 2 Modula 3 
Oberon Objective C Pascal 

Perl PostScript Prolog 
Python Ruby Smalltalk 
PHP TeVTk Bourne Shell 








我 们 将 在 第 2 章 向 读者 显示 如 何 用 Linux 的 shell (bash) 来 开发 小 规模 到 中 等 规模 的 应 用 程序 。 在 
本 书 的 其 他 章节 ， 我 们 主要 集中 在 C 语 言 上 。 我 们 将 集中 精力 从 C 语 言 程序 员 的 视角 探究 Linux 编 程 接 
口 。 我 们 假设 读者 具备 C 语 言 编程 的 基础 。 


1.2.1 Linux 程序 


Linux 应 用 程序 表现 为 两 种 特殊 类 型 的 文件 : 可 执行 文件 和 脚本 文件 。 可 执行 文件 是 计算 机 可 以 直 
接 运行 的 程序 ， 它 们 相当 于 Windows 中 的 . exe 文件 。 脚 本 文件 是 一 组 指令 的 集合 ， 这 些 指令 将 由 另 一 
个 程序 ( 即 解释 器 ) 来 执行 ， 它 们 相当 于 Windows 中 的 .bat 文 件 、.cma 文 件 或 解释 执行 的 BASIC 程 序 。 
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Linux 并 不 要 求 可 执行 文件 或 脚本 文件 具有 特殊 的 文件 名 或 扩展 名 。 文 件 系统 属性 我 们 将 在 第 2 
章 中 讨论 ) 用 来 指明 一 个 文件 是 否 为 可 执行 的 程序 。 在 Linux 中 ， 你 可 以 用 编译 过 的 程序 代 蔡 脚本 〈 反 
之 亦 然 ) 而 不 会 影响 其 他 程序 或 调用 者 。 事 实 上 ， 在 用 户 级 别 ， 这 两 者 本 质 上 没有 任何 不 同 。 

当 登 录 进 Linux 系 统 时 ， 你 与 一 个 shell 程 序 〈 通 常 是 bash) 进行 交互 ， 它 像 Windows 中 的 命令 提示 
窗口 一 样 运行 程序 。 它 在 一 组 指定 的 目录 路 径 下 按照 你 给 出 的 程序 名 搜索 与 之 同名 的 文件 。 搜 索 的 目 
录 路 径 存 储 在 shell 变 量 pATH 里 ， 这 一 点 与 Windows 也 很 类 似 。 搜 索 路 径 〔 你 也 可 以 添加 这 个 路 径 》 由 
系统 管理 员 配 置 ， 它 通常 包含 如 下 一 些 存储 系统 程序 的 标准 路 径 。 

口 /bin: 二 进 制 文件 目录 ， 用 于 存放 启动 系统 时 用 到 的 程序 。 

口 /usr/bin: 用 户 二 进 制 文件 目录 ， 用 于 存放 用 户 使 用 的 标准 程序 。 

O /usr/1ocal/bin: 本 地 二 进 制 文件 目录 ， 用 于 存放 软件 安装 的 程序 。 

系统 管理 员 〈 例 如 root 用 户 ) 登录 后 使 用 的 PATH 变 量 可 能 还 包含 存放 系统 管理 程序 的 目录 ， 如 
/sbin 和 /usr/sbin。 

可 选 的 操作 系统 组 件 和 第 三 方 应 用 程序 可 能 被 安装 在 /opt 目 录 下 , 安装 程序 可 以 通过 用 户 安装 脚 
本 将 路 径 添加 到 ParH 环 境 变量 中 。 


| 从 PATH 中 删除 目录 并 不 是 一 个 好 主意 ， 除 非 确信 你 了 解 这 么 做 的 后 果 . 


注意 ，Linux 像 UNIX 一 样 ， 使 用 冒号 :) 分 隔 PATH 变量 里 的 条 目 ， 而 不 是 像 MS-DOS 和 Windows 
使 用 分 号 (;)。(UNIX 使 用 冒号 :在 先 ， 所 以 应 该 问 微软 为 什么 Windows 要 采用 不 同 的 方式 ， 而 不 是 
问 UNIX 为 什么 与 之 不 同 !) 下 面 是 一 个 PATH 变 量 的 例子 : 

/usr/local/bin: /bin: /usr/bin:.:/home/neil/bin: /usr/X11R6/bin 

上 面 的 pATH 变 量 包 含 的 条 目 有 : 标准 程序 存放 位 置 、 当 前 目录 〈.)、 一 个 用 户 的 家 目录 和 X 视 窗 
系统 的 目录 。 


iett, Linux MEHN (/) 分 隔 文件 名 里 的 目录 名 ， 而 不 是 像 Windows 那 样 用 反 人 针线 (\)。 
而 且 这 次 还 是 UNIX 的 用 法 在 先 - 


12.2 文本 编辑 器 


编写 和 输入 本 书 中 的 代码 需要 使 用 一 个 编辑 器 。 在 典型 的 Linux 系 统 上 有 许多 编辑 器 可 用 ， 较 流 
行 的 编辑 器 是 vi。 

本 书 的 两 位 作者 都 喜欢 Emacs， 所 以 我 们 建议 你 花 一 点 时 间 来 学 习 这 个 功能 强大 的 编辑 器 。 几乎 
所 有 的 Linux 发 行 版 都 将 Emacs 作为 可 选 的 安装 包 ， 你 也 可 以 从 GNU 网 站 http://www.gnu.org 上 得 到 它 ， 
或 者 在 XEmacs 网 站 http://www.xemacs.org 上 得 到 它 的 图 形 化 环境 版 本 。 

要 更 深入 地 学 习 Emacs， 你 可 以 使 用 它 的 在 线 指南 。 首先 运行 emacs 命 令 以 启动 编辑 器 ， 然后 输入 
CtrltH， 接 着 输入 字母 {就 进入 了 在 线 指南 。Emacs 也 有 完整 的 用 户 手册 。 在 Emacs 中 输入 CtrHtH， 接着 
输入 字母 即 可 以 得 到 相关 信息 。 有 些 版 本 的 Emacs 可 能 包含 访问 手册 和 指南 的 菜单 。 


123 ”C 语言 编译 器 


在 POSIX 兼 容 的 系统 中 ，C 语 言 编译 器 被 称 为 c89。 历 史上 ，C 语 言 编译 器 被 简称 为 cc。 许多 年 来 ， 
不 同 厂商 销售 的 类 UNIX 系 统 中 所 带 的 C 语 言 编译 器 均 包含 不 同 的 功能 和 选项 ， 但 它们 一 般 都 称 为 cc。 
在 准备 起 草 POSIX 标 准时 , 事实 上 已 经 不 可 能 制订 出 兼容 所 有 厂商 的 标准 cc 命令 了 。 于 是 , POSIX 
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委员 会 决定 为 C 语 言 编译 器 创建 新 的 标准 命令 ， 这 就 是 c89。 只 要 使 用 这 个 命令 ， 在 任何 机 器 上 ， 它 的 
编译 选项 都 相同 。 

Linux 系 统 尽量 实现 这 些 标准 。 在 Linux 系 统 中 ， 你 会 发 现 c89、 cc 和 gcc 这 些 命令 全 部 或 部 分 地 指 
向 系统 的 C 语 言 编译 器 ， 通 常 是 GNU C 编 译 器 ， 或 acc。 在 UNIX 系 统 中 ， C 语 言 编译 器 几乎 总 被 称 为 
cc. 

在 本 书 中 ， 我 们 将 使 用 gcc， 这 是 因为 它 随 Linux 的 发 行 版 一 起 提供 ， 并 且 它 支持 C 语 言 的 ANSI 标 准 
语法 。 如 果 你 发 现 你 的 UNIX 系 统 中 没有 gcc， 我 们 建议 你 设法 获取 并 安装 它 。 你 可 以 在 
http://www.gnu.org 上 找到 它 。 我 们 在 本 书 中 用 到 gcc 之 处 ， 你 都 可 以 直接 将 其 替换 为 你 的 系统 中 C 语 言 
编译 器 相应 的 命令 。 


实验 你 的 第 一 个 Linux C 语 言 程序 


在 本 例 中 ， 通 过 编写 、 编译 和 运行 你 的 第 一 个 Linux 程 序 来 开始 Linux 的 C 语 言 程序 开发 之 旅 。 还 
是 从 最 有 名 的 Hello World 程 序 开始 吧 。 
(1) 下 面 是 文件 hello.c 的 源 代 码 : 


#include <stdio.h> 


#include <stdlib.h> 


int main() 

t 
printf ("Hello worldin"); 
exit (0); 

) 

Q) 编译 、 链 接 和 运行 程序 。 

$ gcc -o hello hello.c 

$./hello 

Hello World 

$ 


你 调用 GNU C 语 言 编译 器 (在 Linux 中 ， 大 多 数 情况 下 用 cc 也 可 以 ) 将 C 语 言 源 代码 转换 为 可 执行 
文件 hello。 然 后 运行 这 个 程序 ， 它 将 打印 出 欢迎 信息 。 虽然 这 只 是 最 简单 的 一 个 例子 ， 但 如 果 在 你 
的 系统 上 能 做 到 这 一 点 ， 你 就 能 编译 、 运行 本 书 中 以 后 所 有 的 例子 了 。 如 果 无 法 完成 上 述 操作 ， 请 检 
查 你 的 系统 以 确保 已 安装 了 C 语 言 编译 器 。 例如 ， 许多 Linux 发 行 版 有 个 名 为 Software Development ( 软 
件 开发 ) 的 安装 选项 〈 或 类 似 选项 )， 你 应 该 在 Linux 系 统 安装 过 程 中 选中 该 项 ， 从 而 确保 安装 了 所 需 
的 软件 包 。 

因为 这 是 你 运行 的 第 一 个 程序 ， 所 以 有 些 问题 最 好 现在 就 指出 来 。 hello 程 序 很 可 能 在 你 的 家 目 
录 中 。 如 果 PATH 变 量 不 包含 指向 你 的 家 目录 的 条 目 ， shell 就 找 不 到 hel lo 程序 。 更 进一步 ， 如 果 pamH 
变量 中 包含 的 其 中 一 个 目录 包含 另 一 个 名 为 hello 的 程序 ， shell 就 会 执行 那个 程序 。 如 果 PATH 中 这 样 
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的 目录 出 现在 你 的 家 目录 之 前 ， 这 种 情况 也 会 发 生 。 为 了 避免 这 种 潜在 的 问题 ， 你 可 以 在 程序 名 前 
加 上 一 个 ./《〈 例 如 . /hello)。 它 特别 指示 shell 去 执行 当前 目录 下 给 定名 称 的 程序 。( 符 号 . 代表 当前 
目录 。) 

如 果 你 忘记 用 -o name 选 项 告诉 编译 器 可 执行 程序 的 名 字 , 编译 器 就 会 把 程序 放 在 一 个 名 为 a.out 
的 文件 里 (a.out 的 含义 是 assembler output， 即 汇编 输出 )。 如 果 你 确信 编译 了 一 个 程序 但 又 找 不 到 它 ， 
别 忘 了 看 看 有 没有 a.out 文 件 ! 在 UNIX 的 早期 历史 中 ， 想 在 系统 上 玩 游戏 的 人 通常 把 游戏 作为 a out 
来 运行 ， 以 避免 被 系统 管理 员 捉 到 ， 因 此 一 些 UNIX 系 统 每 晚会 定期 地 删除 所 有 名 为 a.out 的 文件 。 
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对 Linux 开 发 人 员 来 说 ， 了 解 软件 工具 和 开发 资源 在 系统 中 存放 的 位 置 是 很 重要 的 。 以 下 几 节 将 
简单 介绍 一 些 重要 的 目录 和 文件 。 

1. 应 用 程序 

应 用 程序 通常 存放 在 系统 为 之 保留 的 特定 目录 中 。 系 统 为 正常 使 用 提供 的 程序 ， 包 括 用 于 程序 开 
发 的 工具 , 都 可 在 目录 /usr/bin 中 找到 ; 系统 管理 员 为 某 个 特定 的 主机 或 本 地 网 络 添加 的 程序 通常 可 
在 目录 /usr/local/bin 或 /opt 中 找到 。 

系统 管理 员 一 般 喜 欢 使 用 /opc 和 /usr/local 目 录 ， 因 为 它们 分 离 了 厂商 提供 及 后 续 添 加 的 文件 
与 系统 本 身 提供 的 应 用 程序 。 一 直 保持 以 这 种 方式 组 织 文件 的 好 处 在 你 需要 升级 操作 系统 时 就 可 以 看 
出 来 了 ， 因 为 只 有 目录 /opt 和 /usr/1ocal 里 的 内 容 需 要 保留 。 我 们 建议 对 于 系统 级 的 应 用 程序 ， 你 
可 以 将 它 放 在 /usr/1local 目 录 中 来 运行 和 访问 所 需 的 文件 。 对 于 开发 用 和 个 人 的 应 用 程序 ， 最 好 在 
你 的 家 目录 中 使 用 一 个 文件 夹 来 存放 它 。 

其 他 一 些 功能 特性 和 编程 系统 可 能 有 其 自己 的 目录 结构 和 程序 目录 。 其 中 最 主要 的 一 个 就 是 X 视 
窗 系统 ， 它 通常 安装 在 /usr/Xx11 或 /usr/bin/X11 目 录 中 。Linux 发 行 版 通常 使 用 X 视 窗 系统 的 X.Org 
基金 会 版 本 ， 它 基于 修订 版 7 (X11R7)。 其 他 类 UNIX 系 统 可 能 选择 X 视 窗 系 统 的 其 他 版 本 ， 它 们 被 安 
装 到 不 同 的 位 置 ， 如 Solaris 提 供 的 Sun Open Windows 被 安装 到 /usr/openwin 目 录 中 。 

GNU 编 译 系统 的 驱动 程序 gcc (你 已 在 本 章 前 面 的 编程 示例 中 用 过 ) 一般 位 于 /usr/bin 或 
/usr/1ocal/bin 目 录 中 ， 但 它 会 从 其 他 位 置 运行 各 种 编译 器 支持 的 应 用 程序 。 这 个 位 置 是 在 编译 编 
译 器 本 身 时 指定 的 ， 并 且 它 随 主机 类 型 的 不 同 而 不 同 。 对 Linux 系 统 来 说 ， 这 个 位 置 可 能 是 
/usr/1ib/gcc/ 目 录 下 的 一 个 版 本 特定 的 子 目 录 。 在 撰写 本 书 时 ， 这 个 目录 在 本 书 其 中 一 位 作者 的 机 
器 上 是 /usr/liby/gcc/i586-suse-linux/4.1.3。GNU C/C++ 编译 器 的 各 个 工具 和 GNU 专 用 的 头 文 
件 都 保存 在 这 里 。 

2. 头 文件 

用 C 语 言及 其 他 语言 进行 程序 设计 时 ， 你 需要 用 头 文件 来 提供 对 常量 的 定义 和 对 系统 函数 及 库 函 
数 调用 的 声明 。 对 C 语 言 来 说 ， 这 些 头 文件 几乎 总 是 位 于 /usr/incluae 目 录 及 其 子 目 录 中 。 那 些 依赖 
于 特定 Linux 版 本 的 头 文件 通常 可 在 目录 /usr/include/sys 和 /usr/include/1inux 中 找到 。 

其 他 编程 系统 也 有 各 自 的 头 文件 ， 这 些 头 文件 被 存储 在 可 被 相应 编译 器 自动 搜索 到 的 目录 里 。 例 
如 ，X 视 窗 系统 的 /usr/include/x11 目 录 和 GNU C++ 的 /asr/include/c++ 目 录 。 

在 调用 C 语 言 编译 器 时 ,你 可 以 使 用 -I 标志 来 包含 保存 在 子 目 录 或 非 标 准 位 置 中 的 头 文件 例如 

$ gcc -I/usr/openwin/include fred.c 
它 指示 编译 器 不 仅 在 标准 位 置 ， 也 在 /usr/openwin/incluae 目 录 中 查找 程序 frea.c 中 包含 的 头 广 
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件 。 请 参看 C 语 言 编译 器 的 使 用 手册 (man acc) 以 了 解 更 多 细节 。 

用 grep 命 令 来 搜索 包含 某 些 特定 定义 和 函数 原型 的 头 文件 是 很 方便 的 .假设 想 知道 用 于 从 程序 中 
返回 退出 状态 的 kaefine 定 义 的 名 字 , 你 只 需 切 换 到 /usr/incluae 目 录 下 ， 然后 用 grep 命 令 搜索 可 能 
的 名 字 部 分 ， 如 下 所 示 : 

$ grep EXIT *.h 

stálib.h:fdefine EXIT, FAILURE $ /* Failing exit status. */ 

Stdlib.h:&define EXIT SUCCESS 0 /* Successful exit status. */ 

$ 

上 面 的 grep 命 令 在 当前 目录 下 的 所 有 以 .h 结 尾 的 文件 中 搜索 字符 串 ExIT_。 在 本 例 中 ， 它 在 
stalib.h 文 件 中 找到 了 你 需要 的 定义 。 

3. 库 文件 

库 是 一 组 预先 编译 好 的 函数 的 集合 ， 这 些 函数 都 是 按照 可 重用 的 原则 编写 的 。 它 们 通常 由 一 组 相 
互 关联 的 函数 组 成 以 执行 某 项 常见 的 任务 ， 比 如 屏幕 处 理 函数 库 (curses 和 ncurses 库 ) 和 数据 库 访 
问 例 程 《abm 库 )。 我 们 将 在 后 续 的 章节 中 介绍 一 些 函数 库 。 

标准 系统 库 文件 一 般 存储 在 /1ib 和 /usr/1ib 目 录 中 。C 语 言 编译 器 《或 更 确切 地 说 是 链接 程序 ) 
需要 知道 要 搜索 哪些 库 文 件 ， 因 为 在 默认 情况 下 ， 它 只 搜索 标准 C 语 言 库 。 这 是 从 那个 计算 机 速度 还 
很 慢 而 且 CPU 运 行 周期 还 很 昂贵 的 时 代 遗 留 下 来 的 问题 。 仅 把 库 文件 放 在 标准 目录 中 ， 就 希望 编译 器 
能 够 找到 它 是 不 够 的 ， 库 文件 必须 遵循 特定 的 命名 规范 并 且 需 要 在 命令 行 中 明确 指定 。 

库 文件 的 名 字 总 是 以 lib 开 头 , 随后 的 部 分 指明 这 是 什么 库 ( 例 如 , ARCHE Em 代表 数学 库 )。 
文件 名 的 最 后 部 分 以 .开始 ， 然 后 给 出 库 文件 的 类 型 : 

口 .a 代表 传统 的 静态 函数 库 ; 

O .so 代表 共享 函数 库 〈 见 后 面 的 解释 )。 

函数 库 通常 同时 以 静态 库 和 共享 库 两 种 格式 存在 ， 你 可 用 1s /usr/1ib 命 令 查 看 。 你 可 以 通过 给 
出 完整 的 库 文件 路 径 名 或 用 -1 标志 来 告诉 编译 器 要 搜索 的 库 文件 。 例 如 ; 

$ gcc -o fred fred.c /usr/lib/libm.a 

这 条 命令 要 求 编译 器 编译 文件 Erea.c， 将 编译 产生 的 程序 文件 命名 为 frea， 并 且 除 了 搜索 标准 
的 C 语 言 函数 库 外 ， 还 搜索 数学 库 以 解决 函数 引用 问题 。 下 面 的 命令 也 能 产生 类 似 的 结果 : 

$ gcc -o fred fred.c -1m 

-lm (在 字母 ] 和 m 之 间 没有 空格 ) 是 简写 方式 (简写 在 UNIX 环 境 里 很 有 用 )， 它 代表 的 是 标准 库 
目录 (本 例 中 是 /usr/1ib) 中 名 为 1ibm.a 的 函数 库 。 -lm 标志 的 另 一 个 好 处 是 如 果 有 共享 库 ， 编 译 器 
会 自动 选择 共享 库 。 

虽然 库 文件 和 头 文件 一 样 ， 通 常 都 保存 在 标准 位 置 ， 但 你 也 可 以 通过 使 用 (大 写字 母 ) 标志 为 
编译 器 增加 库 的 搜索 路 径 。 例 如 : 

$ gcc -o xlifred -L/usr/openwin/lib xilfred.c -1x11 

这 条 命令 用 /usr/openwin/1ib 目 录 中 的 1ipx11 库 版 本 来 编译 和 链接 程序 x11fred。 

4. 静态 库 

函数 库 最 简单 的 形式 是 一 组 处 于 “准备 好 使 用 ”状态 的 目标 文件 。 当 程 序 需 要 使 用 函数 库 中 的 某 
个 函数 时 ， 它 包含 一 个 声明 该 函数 的 头 文件 。 编译 器 和 链接 器 负责 将 程序 代码 和 函数 库 结合 在 一 起 以 
组 成 一 个 单独 的 可 执行 文件 。 你 必须 使 用 -1 选项 指明 除 标准 C 语 言 运行 库 外 还 需 使 用 的 库 。 
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静态 库 ， 也 称 作 归 档 文件 (archive)， 按 惯例 它们 的 文件 名 都 以 .a 结尾 。 比 如 ， 标 准 C 语 言 函 数 库 
/usr/1ib/1ibc.a 和 X11 函数 库 /usr/1ib/1ibX11.a。 

你 可 以 很 容易 地 创建 和 维护 自己 的 静态 库 ， 只 要 使 用 ar (代表 archive， 即 建立 归档 文件 ) 程序 和 
使 用 gcc -c 命 令 对 函数 分 别 进行 编译 。 你 应 该 尽 可 能 把 函数 分 别 保存 到 不 同 的 源 文 件 中 。 如 果 函 数 需 
要 访问 公共 数据 ， 你 可 以 把 它们 放 在 同一 个 源 文件 中 ， 并 使 用 在 该 文件 中 声明 的 静态 变量 。 





静态 库 
在 本 例 中 ， 你 将 创建 一 个 小 型 函数 库 ， 它 包含 两 个 函数 ， 然 后 你 将 在 一 个 示例 程序 中 调用 其 中 一 
个 函数 。 这 两 个 函数 分 别 是 freda 和 bil1， 它 们 只 打印 欢迎 信息 。 
(1) 首先 ， 为 两 个 函数 分 别 创建 各 自 的 源 文件 (将 它们 分 别 命名 为 frea.c 和 bil1.c)。 下 面 是 第 一 
个 源 文件 : 


#include «stdio.h» 


void fred(int arg) 
( 
printf ("fred: we passed %d\n", arg): 
) 
下 面 是 第 二 个 源 文件 : 


#include «stdio.h» 


void bill(char *arg) 
( 
printf("bill: we passed s\n", arg); 

) 

(2) 你 可 以 分 别 编译 这 些 函 数 以 产生 要 包含 在 库 文件 中 的 目标 文件 。 这 可 以 通过 调用 带 有 -c 选 项 
的 C 语 言 编译 器 来 完成 ，-c 选 项 的 作用 是 阻止 编译 器 创建 一 个 完整 的 程序 。 如 果 此 时 试图 创建 一 个 完 
整 的 程序 将 不 会 成 功 ， 因 为 你 还 未 定义 main 函 数 。 

$gcc -c bill.c fred.c 

$1s *.o 

bill.o fred.o 

(3) 现在 编写 一 个 调用 bill 函 数 的 程序 。 首 先 ， 为 你 的 库 文件 创建 一 个 头 文件 。 这 个 头 文件 将 声 
明 你 的 库 文件 中 的 函数 ， 它 应 该 被 所 有 希望 使 用 你 的 库 文件 的 应 用 程序 所 包含 。 把 这 个 头 文件 包含 在 
源 文件 fred.c 和 bil1.c 中 是 一 个 好 主意 ， 它 将 帮助 编译 器 发 现 所 有 错误 。 

J^ 


This is lib.h. It declares the functions fred and bill for users 
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void bill(char *); 
void fred(int); 


(4) 调用 程序 (program.c) 非常 简单 。 它 包含 库 的 头 文件 并 且 调用 库 中 的 一 个 函数 。 


#include «stdlib.h» 


#include "lib.h" 


int main() 
( 
bill('Hello World"); 
exit(0); 

) 

(5) 现在 ， 你 可 以 编译 并 测试 这 个 程序 了 。 你 暂时 为 编译 器 显 式 指定 目标 文件 ， 然 后 要 求 编译 器 
编译 你 的 文件 并 将 其 与 先前 编译 好 的 目标 模块 bi11 .o 链 接 。 

$gcc -c program.c 

$gcc -o program program.o bill.o 

$ ./program 

bill: we passed Hello World 

$ 

(6) 现在 ， 你 将 创建 并 使 用 一 个 库 文 件 。 你 使 用 ar 程序 创建 一 个 归档 文件 并 将 你 的 目标 文件 添加 
进去 。 这 个 程序 之 所 以 称 为 ar， 是 因为 它 将 若干 单独 的 文件 归并 到 一 个 大 的 文件 中 以 创建 归档 文件 或 
集合 。 注 意 ， 你 也 可 以 用 ar 程序 来 创建 任何 类 型 文件 的 归档 文件 与 许多 UNIX 工 具 一 样 ，ar 是 一 个 
通用 工具 )。 

$ar crv libfoo.a bill.o fred.o 

a - bill.o 

a - fred.o 

(7) 库 文件 创建 好 了 ， 两 个 目标 文件 也 已 添加 进去 。 在 某 些 系统 ， 尤 其 是 从 Berkeley UNIX 衍 生 的 
系统 中 ， 要 想 成 功 地 使 用 函数 库 ， 你 还 需要 为 函数 库 生 成 一 个 内 容 表 。 你 可 以 通过 ranl ib 命 令 来 完成 
这 一 工作 。 在 Linux 中 ， 当 你 使 用 的 是 GNU 的 软件 开发 工具 时 ， 这 一 步骤 并 不 是 必需 的 《但 做 了 也 无 
妨 )。 

$ranlib libfoo.a 

你 的 函数 库 现在 可 以 使 用 了 。 你 可 以 在 编译 器 使 用 的 文件 列表 中 添加 该 库 文件 以 创建 你 的 程序 ， 
如 下 所 示 : 

$ gcc -o program program.o libfoo.a 


$ ./program 
bill: we passed Hello World 
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你 也 可 以 使 用 -1 选项 来 访问 函数 库 ， 但 因 其 未 保存 在 标准 位 置 ， 所 以 你 必须 使 用 -L 选 项 来 告诉 编 
译 器 在 何 处 可 以 找到 它 ， 如 下 所 示 : 

$ gcc -o program program.o -L. -lfoo 

.选项 告诉 编译 器 在 当前 目录 CO 中 查找 函数 库 。-1foo 选 项 告诉 编译 器 使 用 名 为 1ibfoo.a 的 
函数 库 (或 者 名 为 1ibfoo.so 的 共享 库 ， 如 果 它 存在 的 话 )。 要 查看 哪些 函数 被 包含 在 目标 文件 、 函 数 
库 或 可 执行 文件 里 ， 你 可 以 使 用 nm 命令 。 如 果 你 查看 program 和 1ibfoo.a， 你 就 会 看 到 函数 库 
libfoo.a 中 包含 fred 和 bil1 两 个 函数 ， 而 program 里 只 包含 函数 bil1。 当 程序 被 创建 时 ， 它 只 包含 
函数 库 中 它 实际 需要 的 函数 。 虽 然 程序 中 的 头 文件 包含 函数 库 中 所 有 函数 的 声明 ， 但 这 并 不 会 将 整个 








函数 库 包含 在 最 终 的 程序 中 。 
如 果 你 熟悉 Windows 软 件 开发 ， 就 会 发 现 两 者 之 间 有 许多 相似 之 处 ， 如 表 1-2 所 示 。 
表 1-2 

项 H UNIX Windows 
目标 模块 func.o FUNC.OBJ 
静态 函数 库 lib.a LIB.LIB 
程序 program PROGRAM. EXE 

5. 共享 库 





静态 库 的 一 个 缺点 是 ， 当 你 同时 运行 许多 应 用 程序 并 且 它们 都 使 用 来 自 同 一 个 函数 库 的 函数 时 ， 
内 存 中 就 会 有 同一 函数 的 多 份 副本 ， 而 且 在 程序 文件 自身 中 也 有 多 份 同样 的 副本 。 这 将 消耗 大 量 宝贵 
的 内 存 和 磁盘 空间 。 

许多 支持 共享 库 的 UNIX 系 统 和 Linux 可 以 克服 上 述 不 足 。 对 共享 库 及 其 在 不 同系 统 上 实现 方式 的 
详细 讨论 超出 了 本 书 的 范围 ， 所 以 我 们 将 仅 讨论 Linux 下 的 实现 。 

共享 库 的 保存 位 置 与 静态 库 是 一 样 的 ， 但 共享 库 有 不 同 的 文件 名 后 绥 。 在 一 个 典型 的 Linux 系 统 
中 ， 标 准 数学 库 的 共享 版 本 是 /usr/1ib/1ibm.so。 

当 一 个 程序 使 用 共享 库 时 ， 它 的 链接 方式 是 这 样 的 ， 程序 本 身 不 再 包含 函数 代码 ， 而 是 引用 运行 
时 可 访问 的 共享 代码 。 当 编译 好 的 程序 被 装载 到 内 存 中 执行 时 ， 函 数 引用 被 解析 并 产生 对 共享 库 的 调 
用 ， 如 果 有 必要 ， 共 享 库 才 被 加 载 到 内 存 中 。 

通过 这 种 方法 ， 系 统 可 以 只 保留 共享 库 的 一 份 副本 供 许多 应 用 程序 同时 使 用 ， 并 且 在 磁盘 上 也 仅 
保存 一 份 。 另 一 个 好 处 是 共享 库 的 更 新 可 以 独立 于 依赖 它 的 应 用 程序 。 例 如 ， 文 件 /1ib/libm.so 就 
是 对 实际 库 文件 修订 版 本 /1ib/1ibm.so.N， 其 中 N 代 表 主 版 本 号 ， 在 写作 本 书 时 它 是 6) 的 符号 链 
接 。 当 Linux 启 动 应 用 程序 时 ， 它 会 考虑 应 用 程序 需要 的 函数 库 版 本 ， 以 防止 函数 库 的 新 版 本 致使 旧 
的 应 用 程序 不 能 使 用 。 


下 面 例子 的 输出 取 自 SUSE 10.3 发 行 版 。 如 果 你 使 用 的 不 是 这 个 发 行 版 ， 输 出 可 能 略 
有 不 同 。 


对 Linux 系 统 来 说 ， 负 责 装载 共享 库 并 解析 客户 程序 函数 引用 的 程序 (动态 装载 器 ) 是 14.so， 也 
可 能 是 la-linux.so.2、1d-1sb.so.2 或 16-1sb,so.3。 用 于 搜索 共享 库 的 额外 位 置 可 以 在 文件 
/eteyla.so.conf 中 配置 ， 如 果 修 改 了 这 个 文件 ， 你 需要 执行 命令 1aconfig 来 处 理 它 〈 例 如 ， 安 装 了 
X 视 窗 系统 后 需要 添加 X11 共享 库 )。 
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你 可 以 通过 运行 工具 1da 来 查看 一 个 程序 需要 的 共享 库 。 例如 ， 如 果 你 在 自己 的 示例 程序 上 运行 
laq， 你 将 看 到 如 下 所 示 的 输出 结果 : 


$ ldd program 
linux-gate.so.l =>  (0xffffe000) 
libc.so.6 => /lib/libc.so.6 (0xb7db4000) 
/lib/ld-linux.so.2 (0xb7efc000) 


在 本 例 中 ， 你 看 到 标准 C 语 言 函 数 库 1ibc) 是 共享 的 〈 .so)。 程 序 需要 的 主 版 本 号 是 6。 其 他 
UNIX 系 统 在 访问 共享 库 时 也 会 有 类 似 的 安排， 详情 请 参考 你 的 系统 文档 。 

共享 库 在 许多 方面 类 似 于 Windows 中 使 用 的 动态 链接 库 。 .so 库 对 应 于 .DLL 文件 ， 它 们 都 是 在 程 
序 运行 时 加 载 ， 而 .a 库 类 似 于 .LTB 文 件 ， 它们 都 包含 在 可 执行 程序 中 。 
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绝 大 多 数 Linux 系 统 都 为 系统 编程 接口 和 标准 工具 提供 了 很 好 的 文档 。 这 是 因为 ， 从 早期 的 UNIX 
系统 开始 ， 程 序 员 就 被 鼓励 为 他 们 的 应 用 程序 提供 手册 页 。 这 些 手册 页 都 可 以 通过 电子 形式 获得 ， 有 
时 也 会 以 印刷 品 的 形式 提供 。 

man 命 令 可 用 来 访问 在 线 手册 页 。 这 些 手册 页 在 质量 和 细节 上 千差万别 。 有 些 可 能 只 是 让 读者 参 
考 其 他 更 详细 的 文档 ， 而 另外 一 些 则 给 出 了 -个 工具 所 支持 的 所 有 选项 和 命令 的 完整 列表 。 无 论 是 哪 
种 情况 ， 手 册页 都 是 一 个 好 的 起 点 。 

GNU 软 件 和 其 他 一 些 自由 软件 还 使 用 名 为 info 的 在 线 文档 系统 。 你 可 以 通过 专用 程序 info 或 通 
过 emacs 编 辑 器 中 的 info 命 令 来 在 线 浏览 全 部 的 文档 。 info 系 统 的 优点 是 ， 你 可 以 通过 链接 和 交叉 引 
用 来 浏览 文档 并 可 直接 跳 转 到 相关 的 章节 。 对 文档 作者 来 说 ， info 系 统 的 优点 是 它 的 文件 可 以 由 排版 
印刷 文档 使 用 的 同一 个 源 文件 自动 生成 。 


实验 手册 页 和 info 


让 我 们 来 看 看 GNU C 语 言 编译 器 (gcc) 的 文档 。 
D 首先 查看 手册 页 。 


$ man gcc 


Gcci1) GNU Gcctl) 


NAME 
gcc - GNU project C and C++ compiler 


SYNOPSIS 
gcc [-c|-S|-E] [-std-standard] 
[-g] [-pg] [-Olevel] 
[-Wwarn...] [-pedantic] 





[-1dir...] [-Ldir...] 
[-Dmacro[-defn]...] [-Umacro] 
[-foption...] [-mmachine-option...] 


[-o outfile] infile... 


Only the most useful options are listed here; see below 
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for the remainder. g++ accepts mostly the same options as 
gec. 


DESCRIPTION 
When you invoke GCC, it normally does preprocessing, com 
pilation, assembly and linking. The ``overall options'' 
allow you to stop this process at an intermediate stage. 
For example, the -c option says not to run the linker. 
Then the output consists of object files output by the 
assembler. 


Other options are passed on to one stage of processing. 
Some options control the preprocessor and others the com 
piler itself. Yet other options control the assembler and 
linker; most of these are not documented here, since we 
rarely need to use any of them. 


如 果 你 愿意 ， 你 可 以 阅读 编译 器 支持 的 各 个 选项 的 相关 信息 。 这 个 例子 中 的 手册 页 相当 长 ， 
只 是 GNU C (MCH) 整个 文档 中 的 一 小 部 分 。 

在 阅读 手册 页 时 ， 你 可 以 按 空 格 键 读 下 一 页 ， 按 Enter 键 (或 Return 键 ， 如 果 你 的 键盘 上 是 Return 
键 的 话 ) 读 下 一 行 ， 按 q 键 退出 。 

(2) 为 了 获得 更 多 关于 GNU C 的 信息 ， 你 可 以 使 用 info 命 令 。 

$ info gcc 





File: gcc.info, Node: Top, Next: G++ and GCC, Up: (DIR) 


Introduction 


This manual documents how to use the GNU compilers, as well as their 
features and incompatibilities, and how to report bugs. It corresponds 
to GCC version 4.1.3. The internals of the GNU compilers, including how 
to port them to new targets and some information about how to write 
front ends for new languages, are documented in a separate manual. 

*Note Introduction: (gccint)Top. 

















* Menu: 

* G++ and GCC:: You can compile C or C++ Applications. 

* Standards: Language standards supported by GCC. 

* Invoking GCC:: Command options supported by "gcc' 

* C Implementation:: How GCC implements the ISO C specification. 
* C Extensions GNU extensions to the C language family. 

* C++ Extension! GNU extensions to the C++ language. 

* Objective-C GNU Objective-C runtime features. 





Compatibility Binary Compatibility 
--zz-Info: (gcc.info.gz)Top, 39 lines --Top. 
Welcome to Info version 4.8. Type ? for help, m for menu item. 


你 将 看 到 一 个 很 长 的 选项 菜单 ， 你 可 以 通过 选择 其 中 的 选项 在 一 个 完全 文本 化 的 文档 中 移动 。 菜 
单项 和 层次 化 的 页 面 布局 允许 你 浏览 很 大 的 文档 。 如 果 印 在 纸 上 的 话 , GNU C 的 文档 有 好 几 百 页 之 多 。 
当然 ，info 系 统 也 包含 它 自己 的 一 个 info 形 式 的 帮助 页 。 如 果 按 下 Ctrl+H 组 合 键 ， 你 将 看 到 一 些 
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帮助 信息 ， 其 中 包括 一 个 如 何 使 用 info 的 指南 。info 程 序 在 许多 Linux 的 发 行 版 里 都 有 ， 它 也 可 以 安 
装 在 其 他 UNIX 系 统 上 。 


1.4 小 结 


在 本 章 中 , 我 们 了 解 了 Linux 程 序 设 计 的 相关 内 容 及 Linux 与 商业 版 本 UNIX 系 统 的 相同 之 处 。 我 们 
介绍 了 UNIX 开 发 者 可 用 的 各 种 各 样 的 编程 系统 .我 们 还 通过 一 个 简单 的 程序 和 函数 库 演示 了 基本 的 C 
语言 工具 ， 并 将 其 与 Windows 中 的 对 应 内 容 进行 了 比较 。 


LER 





shell 程 序 设计 


S 们 在 本 书 的 开始 刚刚 介绍 了 用 C 语 言 进行 Linux 程 序 设计 ， 现 在 却 要 调转 方向 学 习 编写 shell 

程序 ， 这 是 为 什么 ? 在 其 他 的 一 些 操作 系统 中 ， 命 令 行 界 面 只 是 对 图 形 化 界面 的 一 个 补充 。 

但 对 于 Linux 而 言 ， 去 并 非 如 此 。 作 为 Linux 灵 感 来 源 的 UNIX 系 统 最 初 根 本 就 没有 图 形 化 界面 ， 所 有 的 

任务 都 是 通过 命令 行 来 完成 的 。 因 此 ，UNIX 的 命令 行 系统 得 到 了 很 大 的 发 展 ， 并 且 成 为 一 个 功能 

大 的 系统 。Linux 系 统 沿袭 了 这 一 特点 ， 许 多 强大 的 功能 都 可 以 从 shell 中 轻松 实现 。 因 为 shell 对 Linux 
是 如 此 的 重要 ， 并 且 对 自动 化 简单 的 任务 非常 有 用 ， 所 以 我 们 认为 应 该 尽早 介绍 shell 程 序 设计 。 

在 本 章 中 ， 我 们 将 通过 一 些 交互 性 〈 基 于 屏幕 ) 的 例子 来 向 读者 展示 编写 shell 程 序 时 要 用 到 的 语 

法 、 结 构 和 命令 。 这 些 内 容 将 成 为 对 shell 主 要 特性 及 其 效果 的 一 个 很 有 用 的 概要 介绍 。 同 时 ， 我 们 也 

顺便 介绍 两 个 在 shell 中 经 常用 到 的 特别 有 用 的 命令 行 工具 : grep 和 find。 在 介绍 grep 时 ， 我 们 还 将 介 















绍 正则 表达 式 的 基础 知识 ， 它 在 Linux 的 工具 和 程序 设计 语言 (如 Perl、Ruby 和 PHP) 中 都 有 应 用 。 在 
本 章 的 最 后 ， 你 将 学 习 如 何 编写 一 个 真正 的 脚本 程序 ， 本 书 的 后 续 章节 里 将 用 C 语 言 对 它 进行 重 写 和 


扩充 。 本 章 将 介绍 以 下 内 容 ; 

口 什么 是 shell 

口 基本 思路 

O 微妙 的 语法 变量、 条件 判断 和 程序 控制 

口 命令 列表 

口 函数 

O 命令 和 命令 的 执行 

口 here 文 档 

口 调试 

口 grep 命 令 和 正则 表达 式 

口 find 命 令 

因此 ， 无 论 你 是 在 系统 管理 工作 中 正面 对 着 复杂 的 shell 脚 本 ， 或 是 想 实现 自己 最 新 的 了 不 起 (但 
其 实 是 非常 简单 ) 的 想法 ， 或 只 是 想 加 快 完成 一 些 重复 性 的 任务 ， 本 章 对 你 都 很 适用 。 


2.1 为 什么 使 用 shell 编程 


使 用 shell 进 行程 序 设计 的 原因 之 一 是 , 你 可 以 快速 、 简 单 地 完成 编程 。 而 且 , 即使 是 最 基本 的 Linux 
安装 也 会 提供 一 个 shell。 因此, 如 果 你 有 一 个 简单 的 构想 , 则 可 以 通过 它 来 检查 自己 的 想法 是 否 可 行 。 
shell 也 非常 适合 于 编写 一 些 执行 相对 简单 的 任务 的 小 工具 ， 因 为 它们 更 强调 的 是 易于 配置 、 易 于 维护 
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和 可 移植 性 ， 而 不 是 很 看 重 执行 的 效率 。 你 还 可 以 使 用 shell 对 进程 控制 进行 组 织 ， 使 命令 按照 预定 顺 
序 在 前 一 阶段 命令 成 功 完成 的 前 提 下 顺序 执行 。 

虽然 shell 表 面 上 和 Windows 的 命令 提示 符 相似 ， 但 是 它 具备 更 强大 的 功能 以 完成 相当 复杂 的 程序 。 
你 不 仅 可 以 通过 它 执行 命令 、 调 用 Linux 工 具 ， 还 可 以 自己 编写 程序 。shell 执 行 shell 程 序 ， 这 些 程序 通 
第 被 称 为 脚本 ， 它 们 是 在 运行 时 解释 执行 的 。 这 使 得 调试 工作 比较 容易 进行 ， 因 为 你 可 以 逐 行 地 执行 
指令 ， 而 且 节 省 了 重新 编译 的 时 间 。 然 而 ， 这 也 使 得 shell 不 适合 用 来 完成 时 间 紧 迫 型 和 处 理 器 忙碌 型 
的 任务 。 


22 一 点 哲学 


现在 ， 我 们 来 关注 一 点 UNIX (当然 也 是 Linux) 的 哲学 。UNIX 架 构 非常 依赖 于 代码 的 高 度 可 重 
用 性 。 如果 你 编写 了 一 个 小 巧 而 简单 的 工具 ， 其 他 人 就 可 以 将 它 作为 一 根 链条 上 的 某 个 环节 来 构成 一 
条 命令 。Linux 让 用 户 满意 的 原因 之 一 就 是 它 提供 了 各 种 各 样 的 优秀 工具 。 下 面 是 一 个 简单 的 例子 


$ 1s -al | more 


这 个 命令 使 用 了 ls 和 more 工 具 并 通过 管道 实现 了 文件 列表 的 分 屏 显示 . 每 个 工具 就 是 一 个 组 成 部 
件 。 通 常 你 可 以 将 许多 小 巧 的 脚本 程序 组 合 起 来 以 创建 一 个 庞大 而 复杂 的 程序 。 
例如 ， 如 果 你 想 打印 bash 使 用 手册 的 参考 副本 ， 可 以 使 用 如 下 命令 ; 


$ man bash | col -b | lpr 


此 外 ， 因 为 Linux 具 备 自动 文件 类 型 处 理 功能 ， 所 以 使 用 这 些 工具 的 用 户 一 般 不 必 了 解 它们 是 用 
哪 种 语言 编写 的 。 如 果 想 要 这 些 工具 运行 得 更 快 ， 常 见 的 做 法 是 首先 在 shell 中 实现 工具 的 原型 一旦 
确定 值得 这 么 做 ， 然 后 再 用 C 或 Ct+、Perl、Python 或 者 其 他 执行 得 更 快速 的 语言 来 重新 实现 它们 。 相 
反 ， 如 果 在 shell 中 这 些 工具 工作 得 已 足够 好 ， 就 不 必 再 重新 实现 它们 。 

是 否 需要 重新 实现 脚本 程序 取决 于 你 是 否 需要 对 它 进行 优化 ， 是 否 需 要 将 程序 移植 到 其 他 系统 ， 
是 可 需要 让 它 更 易于 修改 以 及 它 是 否 偏离 了 其 最 初 的 设计 目的 《这 种 情况 经 常 发 生 )。 

如 果 你 对 shell 肢 本 充满 好 奇 ，Linux 系 统 中 已 经 区 有 许多 的 shell 脚 本 例子 ， 包 括 软件 包 安 
装 程序 、.xinitrc 和 startx 文 件 以 及 /etc/rc.d 目 录 中 用 于 启动 时 配置 系统 的 脚本 程序 。 


23 什么 是 shell 


在 开始 讨论 如 何 使 用 shell 进 行程 序 设计 之 前 ， 我 们 先 来 回顾 一 
下 shell 的 作用 以 及 Linux 系 统 中 提供 的 各 种 shell。shell 是 一 个 作为 用 
户 与 Linux 系 统 间接 口 的 程序 , 它 允 许 用 户 向 操作 系统 输入 需要 执行 
的 命令 。 这 点 与 Windows 的 命令 提示 符 类 似 , 但 正如 先前 所 提 到 的 ， 
Linux shell 的 功能 更 强大 。 例 如 ， 我 们 可 以 使 用 < 和 > 对 输入 输出 进 
行 重 定向 ， 使 用 | 在 同时 执行 的 程序 之 间 实 现 数据 的 管道 传递 ， 使 
用 $(...) 获 取 子 进程 的 输出 。 在 Linux 中 安装 多 个 shell 是 完全 可 行 
的 , 用 户 可 以 挑选 一 种 自己 喜欢 的 shell 来 使 用 。 图 2-1 显 示 了 shell( 实 
际 上 是 两 种 shell，bash 和 csh) 和 其 他 程序 环绕 在 Linux 内 核 的 四 周 。 

由 于 Linux 是 高 度 模块 化 的 系统 , 所 以 你 可 以 从 各 种 不 同 的 shell 
中 选择 一 种 来 使 用 ， 虽 然 它 们 中 的 大 多 数 都 是 从 最 初 的 Bourne shell 图 2-1 
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演变 而 来 的 。 在 Linux 系 统 中 ， 总 是 作为 /bin/sh 安 装 的 标准 shell 是 GNU 工 具 集 中 的 bash (GNU 
Bourne-Again Shell)。 因 为 它 作为 一 个 优秀 的 shell， 总 是 安装 在 Linux 系 统 上 ， 而 且 它 是 开源 的 并 且 可 
以 被 移植 到 几乎 所 有 的 类 UNIX 系 统 上 ， 所 以 我 们 把 它 作为 将 要 使 用 的 shell。 在 本 章 中 ， 我 们 将 使 用 
bash 的 第 3 版 ， 并 且 在 大 多 数 情况 下 只 使 用 那些 所 有 POSIX 兼 容 的 shell 都 具备 的 功能 。 我 们 假设 bash 被 
安装 为 /bin/sh 并 且 它 是 你 的 登录 所 使 用 的 默认 shell。 在 大 多 数 Linux 发 行 版 中 , 默认 的 shell 程 序 /bin/sh 
实际 上 是 对 程序 /bin/bash 的 一 个 连接 。 

你 可 以 使 用 如 下 命令 来 查看 bash 的 版 本 号 : 

$ /bin/bash --version 

GNU bash, version 3.2.9(1l)-release (i686-pc-linux-gnu) 

Copyright (C) 2005 Free Software Foundation, Inc. 





如 果 你 想 要 切换 到 另 一 个 shell ( 例如 ，bash 不 是 你 的 系统 中 默认 的 shell) ， 你 只 需 直 
接 执行 需要 的 shell 程 序 ( 例如 ，/bin/bash ) 就 可 以 运行 新 的 shell 并 且 改 变 命令 提示 符 了 . 
如 果 你 使 用 的 是 UNIX 系 统 并 且 bash 没 有 被 安装 ， 你 可 以 从 GNU Web 网 站 www.gnu.org 上 免 


货 下 载 它 。 它 的 源 代码 具有 高 度 的 可 移植 性 ， 它 在 你 的 UNIX 版 本 上 编译 成 功 几 乎 不 会 有 
什么 问题 . 











当 你 创建 Linux 用 户 时 ， 你 可 以 设置 这 个 用 户 要 使 用 的 shell， 这 个 工作 既 可 以 在 创建 用 户 时 完成 ， 
也 可 以 在 创建 用 户 之 后 ， 通 过 修改 用 户 信息 来 完成 。 图 2-2 显 示 了 使 用 Fedora 选 择 用 户 shell 的 界面 。 
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图 22 
还 有 许多 免费 的 或 商业 的 shell 可 以 使 用 ， 表 2-1 对 常用 的 shell 做 了 一 个 简单 的 总 结 。 
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表 2-1 
shell E. 相关 历史 

sh (Bourne) 源 于 UNIX 早 期 版 本 的 最 初 的 shell 

esh, tesh, zsh C shell 及 其 变 体 ， 最 初 是 由 Bill Joy 在 Berkeley UNIX 上 创建 的 。 它 可 能 是 继 bash 和 Korn shell 
之 后 第 三 个 最 流行 的 shell 

ksh. pdksh kom shell 和 它 的 公共 域 兄弟 pdksh (public domain kom shell) 由 David Kom 编 写 ， 它 是 许多 商 
业 版 本 UNIX 的 默认 shell 

bash 来 自 GNU 项 目的 bash 或 Bourne Again Shell 是 Linux 的 主要 shell, 它 的 优点 是 可 以 免费 获取 其 源 


代码 ， 即 使 你 的 UNIX 系 统 目前 没有 运行 它 ， 它 也 很 可 能 已 经 被 移植 到 该 系统 中 。bash 与 Kom 
shell 有 许多 相似 之 处 
除了 C shell 和 少数 变 体 以 外 ， 所 有 这 些 shell 都 很 相似 ， 并 且 都 与 X/Open 4.2 和 POSIX 1003.2 规 范 中 
对 于 shell 的 规定 非常 一 致 。POSIX 1003.2 对 于 shell 的 规定 很 少 ， 但 在 X/Open 中 的 扩展 规定 则 提供 了 一 
个 更 加 友好 、 功 能 更 加 强大 的 shell。X/Open 通 常 是 一 个 提出 更 多 要 求 的 规范 ， 但 遵循 它 的 系统 也 更 加 
友好 。 


24 管道 和 重 定向 


在 深入 探讨 shell 程 序 设计 的 细节 之 前 ， 我 们 需要 先 介绍 一 下 如 何 才能 对 Linux 程 序 (不 仅仅 是 shell 
程序 ) 的 输入 输出 进行 重 定向 。 


24.1 重 定向 输出 


读者 可 能 已 经 对 某 些 类 型 的 重 定向 比较 熟悉 了 ， 例 如 : 

$ 1s -1 > lsoutput.txt 
这 条 命令 把 ls 命令 的 输出 保存 到 文件 1soutput .txt 中 。 

然而 ， 重 定向 所 包含 的 内 容 可 比 这 个 简单 的 例子 所 显示 的 要 多 得 多 。 你 将 在 第 3 章 学 习 更 多 关于 
标准 文件 描述 符 的 内 容 ， 现 在 你 只 需 知道 文件 描述 符 0 代表 一 个 程序 的 标准 输入 ， 文 件 描述 符 1 代表 标 
准 输出 ， 而 文件 描述 符 2 代表 标准 错误 输出 。 你 可 以 单独 地 重 定向 其 中 任何 一 个 。 事 实 上 ， 你 还 可 以 
重 定向 其 他 文件 描述 符 ， 但 对 标准 文件 描述 符 0、1、2 以 外 的 文件 描述 符 进行 重 定向 的 情况 很 少见 。 

上 面 的 例子 通过 > 操作 符 把 标准 输出 重 定向 到 一 个 文件 。 在 默认 情况 下 ， 如 果 该 文件 已 经 存在 ， 
它 的 内 容 将 被 覆盖 。 如 果 你 想 改变 默认 行为 ， 你 可 以 使 用 命令 set -o noclobber (或 set -C) 命 令 设 
置 noclobber 选 项 ， 从 而 阻止 重 定向 操作 对 一 个 已 有 文件 的 覆盖 。 你 可 以 使 用 set «o noclobber 命 
令 取消 该 选项 。 你 将 在 本 章 后 面 的 内 容 中 看 到 更 多 的 set 命 令 选项 。 

你 可 以 用 >> 操 作 符 将 输出 内 容 附加 到 一 个 文件 中 。 例 如 : 

$ ps »» lsoutput.txt 
这 条 命令 会 将 ps 命令 的 输出 附加 到 指定 文件 的 尾部 。 

如 果 想 对 标准 错误 输出 进行 重 定向 ， 你 需要 把 想 要 重 定向 的 文件 描述 符 编号 加 在 > 操作 符 的 前 面 。 
因为 标准 错误 输出 的 文件 描述 符 编号 是 2， 所 以 使 用 2> 操 作 符 。 当 需要 丢弃 错误 信息 并 阻止 它 显示 在 
屏幕 上 时 ， 这 个 方法 很 有 用 。 

假设 你 想 用 xil1 命 令 在 一 个 脚本 程序 里 终止 一 个 进程 , 那么 总 是 存在 这 种 可 能 性 , 即 在 ki11 命 令 
执行 之 前 ， 那 个 需要 终止 的 进程 就 已 经 结束 了 。 如 果 出 现 这 种 情况 ，kil1 命令 将 向 标准 错误 输出 写 一 
条 错误 信息 ， 并 且 在 默认 情况 下 ， 这 条 信息 将 会 显示 在 屏幕 上 。 通 过 对 标准 输出 和 标准 错误 输出 都 进 
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行 重 定向 ， 你 就 可 以 阻止 Ki11 命 令 向 屏幕 上 写 任何 内 容 了 。 

下 面 的 命令 将 把 标准 输出 和 标准 错误 输出 分 别 重 定向 到 不 同 的 文件 中 : 

$ kill -HUP 1234 »killout.txt 2»killerr.txt 

如 果 你 想 把 两 组 输出 都 重 定向 到 一 个 文件 中 ， 你 可 以 用 >s 操 作 符 来 结合 两 个 输出 。 如 下 所 示 : 

$ kill -1 1234 »killouterr.txt 2»&1 

这 条 命令 将 把 标准 输出 和 标准 错误 输出 都 重 定向 到 同一 个 文件 中 。 请 注意 操作 符 出 现 的 顺序 。 这 
条 命令 的 含义 是 “将 标准 输出 重 定向 到 文件 killouterr .txt， 然 后 将 标准 错误 输出 重 定向 到 与 标准 
输出 相同 的 地 方 。” 如 果 顺 序 有 误 ， 重 定向 将 不 会 按照 你 预期 的 那样 执行 。 

因为 可 以 通过 返回 码 (我 们 将 在 本 章 的 后 面 对 其 进行 详细 介绍 ) 来 了 解 xi11 命 令 的 执行 结果 ， 所 
以 通常 并 不 需要 保存 标准 输出 或 标准 错误 输出 的 内 容 。 你 可 以 用 Linux 的 通用 “回收 站 ”/Gev/null 
来 有 效 地 丢弃 所 有 的 输出 信息 ， 如 下 所 示 : 


$ kill -1 1234 >/dev/null 2>&1 
2.4.2 重 定向 输入 
你 不 仅 可 以 重 定向 标准 输出 ， 还 可 以 重 定向 标准 输入 。 例 如 : 


$ more < killout.txt 

很 明显 ， 在 Linux 下 这 样 做 意义 不 大 ， 因 为 Linux 的 more 命 令 可 以 接受 文件 名 作为 参数 ， 这 与 
Windows 命 令 行 中 对 应 的 命令 不 同 。 
243 ”管道 

你 可 以 用 管道 操作 符 | 来 连接 进程 。Linux 与 MS-DOS 不 同 ， 在 Linux 下 通过 管道 连接 的 进程 可 以 同 
时 运行 , 并 且 随 着 数据 流 在 它们 之 间 的 传递 可 以 自动 地 进行 协调 。 举 一 个 简单 的 例子 , 你 可 以 使 用 sort 
命令 对 ps 命令 的 输出 进行 排序 。 

如 果 不 使 用 管道 ， 你 就 必须 分 几 个 步骤 来 完成 这 个 任务 ， 如 下 所 示 : 


$ ps > psout.txt 
$ sort psout.txt » pssort.out 


一 个 更 精巧 的 解决 方案 是 用 管道 来 连接 进程 ， 如 下 所 示 : 
$ ps | sort > pssort.out 
如 果 想 在 屏幕 上 分 页 显示 输出 结果 ， 你 可 以 再 连接 第 三 个 进程 nore， 将 它们 都 放 在 同一 个 命令 行 
如 下 所 示 : 
$ ps | sort | more 
允许 连接 的 进程 数目 是 没有 限制 的 。 假 设 你 想 看 看 系统 中 运行 的 所 有 进程 的 名 字 ， 但 不 包括 shell 
本 身 ， 可 以 使 用 下 面 的 命令 : 

$ ps -xo comm | sort | uniq | grep -v sh | more 

这 个 命令 首先 按 字母 顺序 排序 ps 命令 的 输出 , 再 用 uniq 命 令 去 除名 字 相同 的 进程 , 然后 用 grep -v 
sh 命令 删除 名 为 sh 的 进程 ， 最 终 将 结果 分 页 显示 在 屏幕 上 。 

如 你 所 见 ， 与 使 用 一 系列 单独 的 命令 并 且 每 个 命令 都 带 有 自己 的 临时 文件 相 比 ， 这 是 一 个 更 精巧 
的 解决 方案 。 但 这 里 有 一 点 需要 引起 注意 : 如 果 你 有 一 系列 的 命令 需要 执行 ， 相 应 的 输出 文件 是 在 这 
一 组 命令 被 创建 的 同时 立刻 被 创建 或 写 入 的 ， 所 以 决 不 要 在 命令 流 中 重复 使 用 相同 的 文件 名 。 如 果 你 
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尝试 执行 如 下 命令 : 
cat mydata.txt | sort | uniq > mydata.txt 
你 最 终 将 得 到 一 个 空 文件 ， 因为 你 在 读 取 文件 myaata.cxt 之 前 就 已 经 柳 盖 了 这 个 文件 的 内 容 。 
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现在 你 已 了 解 了 一 些 基本 的 shell 操 作 ， 是 时 候 开 始 介绍 一 些 真正 的 shell 脚 本 程序 了 。 编 写 shell 脚 
本 程序 有 两 种 方式 。 你 可 以 输入 一 系列 命令 让 shell 交 互 地 执行 它们 ， 也 可 以 把 这 些 命令 保存 到 一 个 文 
件 中 ， 然 后 将 该 文件 作为 一 个 程序 来 调用 。 


251 交互 式 程序 


在 命令 行 上 直接 输入 shell 脚 本 是 一 种 测试 短小 代码 段 的 简单 而 快捷 的 方式 。 如 果 你 正 
脚本 或 仅仅 是 为 了 进行 测试 ， 使 用 这 种 方式 是 非常 有 用 的 。 

假设 你 想 要 从 大 量 C 语 言 源 文件 中 查找 包含 字符 串 posTx 的 文件 。 与 其 使 用 grep 命 令 在 每 个 文件 
中 搜索 字符 串 ， 然 后 再 分 别 列 出 包含 该 字符 串 的 文件 ， 不 如 用 下 面 的 交互 式 脚本 来 执行 整个 操作 ， 

$ for file in * 

» do 

> if grep -1 POSIX $file 

» then 

> more $file 

> fi 

> done 

posix 

This is a file with POSIX in it - treat it well 





请 注意 ， 当 shell 期 待 进一步 的 输入 时 ， 正常 的 $ shell 提 示 符 将 改变 为 > 提示 符 。 你 可 以 一 直 输 入 下 
由 shell 来 判断 何 时 输入 完毕 并 立刻 执行 脚本 程序 。 
在 这 个 例子 中 ，grep 命 令 输 出 它 找到 的 包含 PosIx 字 符 串 的 文件 ， 然后 more 命 令 将 文件 的 内 容 显 
下 在 屏幕 上 。 最 后 ， 返 回 shell 提 示 符 。 还 要 注意 的 是 ， 你 用 shell 变 量 来 处 理 每 个 文件 ， 以 使 该 脚本 自 
文档 化 。 你 也 可 以 将 变量 名 起 为 i， 但 是 变量 名 file 更 容易 理解 。 

shell 还 提供 了 通配符 扩展 〈 通 常 称 为 globbing)。 你 一 定 已 注意 到 可 以 用 通配符 * 来 匹配 一 个 字符 
串 。 但 是 你 可 能 不 知道 可 以 用 通配符 ?来 匹配 单个 字符 , 而 [set] 允许 匹配 方 括号 中 任何 一 个 单个 字符 ， 
[人 set] 对 方 括号 中 的 内 容 取 反 , 即 匹 配 任何 没有 出 现在 给 出 的 字符 集中 的 字符 。 扩展 的 花 括号 (} (只 
能 用 在 部 分 shell 中 ， 其 中 包括 bash) 允许 你 将 任意 的 字符 串 组 放 在 一 个 集合 中 ， 以 供 shell 进 行 扩展 。 
例如 : 

$ 1s my (finger,toe)s 
这 个 命令 将 列 出 文件 my_fingers 和 my_toes， 它 使 用 shell 来 检查 当前 目录 下 的 每 个 文件 。 当 我 们 在 
本 章 结尾 详细 介绍 grep 命 令 和 正则 表达 式 的 强大 功能 时 ， 我 们 将 回 过 头 来 再 次 研究 匹配 模式 中 的 这 些 
规则 。 

有 经 验 的 Linux 用 户 可 能 会 用 一 种 更 有 效 的 方式 来 执行 这 个 简单 的 操作 。 也 许 使 用 如 下 的 命令 : 

$ more "grep -1 POSIX *' 


或 使 用 功能 相同 的 另 一 种 命令 形式 : 


去 
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$ more $(grep -1 POSIX *) 

此 外 ， 下 面 的 命令 将 输出 包含 PosITXx 字 符 串 的 文件 名 : 

$ grep -1 POSIX * | more 

在 上 面 的 脚本 中 ， 你 看 到 shell 利 用 其 他 命令 (如 grep 和 more) 来 完成 主要 的 工作 。shell 本 身 只 是 
允许 你 将 几 个 现 有 的 命令 结合 在 一 起 ， 以 构成 一 个 新 的 功能 强大 的 命令 。 你 将 在 后 面 的 脚本 示例 中 看 
到 通配符 扩展 的 多 次 应 用 , 并 且 我 们 还 将 在 本 章 中 介绍 grep 命 令 和 正则 表达 式 时 详细 讨论 整个 扩展 的 
细节 。 

如 果 每 次 想 要 执行 一 系列 命令 时 ， 你 都 要 经 过 这 么 一 个 元 长 的 输入 过 程 ， 将 非常 令 人 烦恼 。 你 需要 
将 这 些 命令 保存 到 一 个 文件 中 ， 即 我 们 常 说 的 shell 肢 本， 这 样 你 就 可 以 在 需要 的 时 候 随 时 执行 它们 了 。 


2.5.2 ”创建 脚本 


首先 ， 你 必须 用 一 个 文本 编辑 器 来 创建 一 个 包含 命令 的 文件 ， 将 其 命名 为 first， 它 的 内 容 如 下 
所 示 

#1/bin/sh 

# first 

# This file looks through all the files in the current 


# directory for the string POSIX, and then prints the names of 
# those files to the standard output. 


for file in * 
do 
if grep -q POSIX $file 
then 
echo $file 


exit 0 

程序 中 的 注释 以 # 符 号 开始 ， 一 直 持续 到 该 行 的 结束 。 按 照 惯例 ， 我 们 通常 把 # 放 在 第 一 列 。 
出 这 样 一 个 笼统 的 陈述 之 后 ， 请 注意 第 一 行 #!/bin/sh， 它 是 一 种 特殊 形式 的 注释 ，#! 字 符 告诉 
同一 行 上 紧 跟 在 它 后 面 的 那个 参数 是 用 来 执行 本 文件 的 程序 。 在 这 个 例子 中 ，/bin/sh 是 默认 的 shell 
程序 。 

请 注意 注释 中 使 用 的 是 绝对 路 径 .。 考虑 到 向 后 兼容 性 ， 这 个 路 径 按 惯例 最 好 不 要 超过 32 

个 字符 ， 因 为 一 些 老 版 本 的 UNIX 在 使 用 # ! 时 只 能 使 用 这 个 限制 之 内 的 字符 数 ， 虽 然 Linux 

通常 不 存在 这 样 的 限制 。 

因为 脚本 程序 本 质 上 被 看 作 是 shell 的 标准 输入 ,所 以 它 可 以 包含 任何 能 够 通过 你 的 PaTH 环 境 变量 
引用 到 的 Linux 命 令 。 

exit 命 令 的 作用 是 确保 脚本 程序 能 够 返回 一 个 有 意义 的 退出 码 (在 本 章 的 后 面 将 对 此 进行 详细 介 
绍 )。 当 程序 以 交互 方式 运行 时 ， 我 们 很 少 需要 检查 它 的 退出 码 ， 但 如 果 你 打算 从 另 一 个 脚本 程序 里 
调用 这 个 脚本 程序 并 查看 它 是 否 执行 成 功 ， 那 么 返回 一 个 适当 的 退出 码 就 很 重要 了 。 即 使 你 从 来 也 没 
打算 允许 你 的 脚本 程序 被 另 一 个 脚本 程序 调用 ， 你 也 应 该 在 退出 时 返回 一 个 合理 的 退出 码 。 请 相信 自 
己 的 脚本 程序 是 有 用 的 ， 它 总 有 一 天 会 作为 其 他 脚本 程序 的 一 部 分 而 被 重用 。 
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在 shell 程 序 设 计 里 ，0 表 示 成 功 。 因 为 这 个 脚本 程序 并 不 能 检查 到 任何 错误 ， 所 以 它 总 是 返回 一 
个 表示 成 功 的 退出 码 。 我 们 将 在 本 章 后 面 详细 介绍 exit 命 令 时 ， 再 回 过 头 来 解释 用 0 表示 成 功 的 原因 。 
请 注意 ， 这 个 脚本 没有 使 用 任何 的 文件 扩展 名 或 后 缓 。 一 般 情 况 下 ，Linux 和 UNIX 很 少 利用 文件 
扩展 名 来 决定 文件 的 类 型 。 你 可 以 为 脚本 使 用 . sh 或 者 其 他 扩展 名 ， 但 shell 并 不 关心 这 一 点 。 大 多 数 
预 安装 的 脚本 程序 并 没有 使 用 任何 文件 扩展 名 , 检查 这 些 文件 是 否 是 脚本 程序 的 最 好 方法 是 使 用 file 
命令 ， 例 如 ，file first 或 file /bin/bash。 你 可 以 使 用 任何 适用 于 你 的 工作 环境 或 适合 于 你 的 方式 。 


2.5.3 ”把 脚本 设置 为 可 执行 


现在 你 已 经 有 了 自己 的 脚本 文件 ， 运 行 它 有 两 种 方法 。 比 较 简单 的 方法 是 调用 shell， 并 把 脚本 文 
件 名 当成 一 个 参数 ， 如 下 所 示 ; 

$ /bin/sh first 

这 可 以 工作 ， 但 如 果 能 像 对 待 其 他 Linux 命 令 那样 ， 只 输入 脚本 程序 的 名 字 就 可 以 调用 它 就 更 好 
了 。 你 可 以 使 用 chmoa 命 令 来 改变 这 个 文件 的 模式 ， 使 得 这 个 文件 可 以 被 所 有 用 户 执行 ， 如 下 所 示 : 

$ chmod +x first 


当然 , 这 并 不 是 使 用 chmod 命 令 将 一 个 文件 设置 为 可 执行 的 唯一 方式 , 请 用 man chmoa 
命令 查看 它 的 八进制 参数 和 其 他 选项 用 法 。 


然后 你 可 以 用 下 面 的 命令 来 执行 它 : 

$ first 

你 可 能 会 看 到 一 条 错误 信息 告诉 你 未 找到 命令 。 这 种 情况 很 可 能 发 生 ， 因 为 shell 环 境 变量 PATH 并 
没有 被 设置 为 在 当前 目录 下 查找 要 执行 的 命令 。 要 解决 这 个 问题 ， 一 种 办 法 是 在 命令 行 上 直接 输入 合 
令 PATH=$PATH: .或 编辑 你 的 .bash_profile 文 件 ， 将 刚才 这 条 命令 添加 到 文件 的 末尾 ， 然 后 退出 合 
录 后 再 重新 登录 进来 。 另 外 ， 你 也 可 以 在 保存 脚本 程序 的 目录 中 输入 命令 ./first， 该 命令 的 作用 是 
把 脚本 程序 的 完整 的 相对 路 径 告诉 shell。 

用 ./ 来 指定 路 径 还 有 另 一 个 好 处 , 它 能 够 保证 你 不 会 意外 执行 系统 中 与 你 的 脚本 文件 同名 的 另 一 
个 命令 。 














你 不 应 该 用 这 种 方法 来 修改 超级 用 户 ( 一 般 其 用 户 名 为 root) 的 PATH 变 量 。 这 是 一 个 
安全 方面 的 漏洞 , 因为 以 root 用 户 身份 登录 的 系统 管理 员 可 能 会 因此 误 调用 了 某 个 标准 命 
令 的 伪装 版 本 。 本 书 其 中 一 位 作者 就 曾经 这 样 做 过 一 次 ， 目 的 当然 是 为 了 向 系统 管理 员 指 
出 这 一 点 ! 即使 对 于 普通 用 户 ， 把 当前 目录 包括 在 PATH 变量 中 也 多 少 有 些 危 险 . 因此， 如 
果 你 非常 关心 系统 的 安全 ， 最 好 的 办 法 是 养 成 在 执行 当前 目录 中 的 所 有 命令 时 ， 在 其 前 面 
都 加 上 一 个 ./ 的 好 习惯 。 


在 确信 你 的 脚本 程序 能 够 正确 执行 后 ， 你 可 以 把 它 从 当前 目录 移 到 一 个 更 合适 的 地 方 去 。 如 果 这 
个 命令 只 供 你 本 人 使 用 ， 你 可 以 在 自己 的 家 目录 中 创建 一 个 bin 目 录 ， 并 且 将 该 目录 添加 到 你 自己 的 
PATH 变量 中 。 如 果 你 想 让 其 他 人 也 能 够 执行 这 个 脚本 程序 ， 你 可 以 将 /usr/local/bin 或 其 他 系统 目 
录 作 为 添加 新 程序 的 适当 位 置 。 如 果 你 在 系统 上 没有 root 权 限 ， 你 可 以 要 求 系统 管理 员 帮 你 复制 你 的 
文件 ， 当 然 你 首先 必须 让 他 们 相信 这 些 程序 的 价值 才 行 。 为 了 防止 其 他 用 户 修改 脚本 程序 ， 哪 怕 只 是 
意外 地 修改 ， 你 也 应 该 去 掉 脚 本 程序 的 写 权限 。 系 统管 理 员 用 来 设置 文件 属 主 和 访问 权限 的 一 系列 合 
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令 如 下 所 示 : 
# cp first /usr/local/bin 
# chown root /usr/local/bin/first 
# chgrp root /usr/local/bin/first 
# chmod 755 /usr/local/bin/first 


注意 ， 你 在 这 里 不 是 修改 访问 权限 标志 的 特定 部 分 ， 而 是 使 用 chmoa 命 令 的 绝对 格式 ， 因 为 你 清 
楚 地 知道 你 需要 的 访问 权限 。 

如 果 你 愿意 ， 还 可 以 使 用 chmoa 命 令 相对 长 一 些 但 可 能 含义 更 明确 的 格式 ， 如 下 所 示 : 

# chmod u=rwx,go=rx /usr/local/bin/first 


更 多 chmod 命 令 的 详细 资料 请 参考 它 的 使 用 手册 。 


在 Linux 系 统 中 ， 如 果 你 拥有 包含 业 个 文件 的 目录 的 写 权限 ， 就 可 以 删除 这 个 文件 。 
为 安全 起 见 ， 应 该 确保 只 有 超级 用 户 才能 对 你 想 保证 文件 安全 的 目录 执行 写 操作 。 因 为 目 
录 只 是 另 一 种 类 型 的 文件 ， 所 以 拥有 对 一 个 目录 文件 写 权限 的 用 户 可 以 添加 和 删除 目录 文 
件 中 的 名 称 、 











2.6 shell 的 语法 


现在 你 已 看 过 一 个 简单 的 shell 程 序 示例 ， 是 时 候 来 深入 研究 shell 强 大 的 程 请 
-种 很 容易 学 习 的 程序 设计 

们 分 别 进行 交互 式 的 测试 。 

我 们 将 学 习 以 下 内 容 : 

口 变量 ， 字符 串 、 数 字 、 环 境 和 参数 

O 条 件 ，shell 中 的 布尔 值 

O 程序 控制 : if、elif、for、 while. until. case 

口 命令 列表 

口 函数 

口 shell 内 置 命令 

口 获取 命令 的 执行 结果 

口 here 文 档 
2.6.1 变量 

在 shell 里 ， 使 用 变量 之 前 通常 并 不 需要 事先 为 它们 做 出 声明 。 你 只 是 通过 使 用 它们 〈 比 如 当 你 给 
它们 赋 初 始 值 时 〉 来 创建 它们 。 在 默认 情况 下 ， 所 有 变量 都 被 看 作 字符 串 并 以 字符 串 来 存储 ， 即 使 它 
们 被 赋值 为 数值 时 也 是 如 此 。shell 和 一 些 工具 程序 会 在 需要 时 把 数值 型 字符 串 转换 为 对 应 的 数值 以 对 
它们 进行 操作 。Linux 是 一 个 区 分 大 小 写 的 系统 ， 因 此 shell 认 为 变量 fo0 与 roo 是 不 同 的 ， 而 这 两 者 与 
FoO 又 是 不 同 的 。 

在 shell 中 ， 你 可 以 通过 在 变量 名 前 加 一 个 符号 来 访问 它 的 内 容 。 无 论 何 时 你 想 要 获取 变量 内 容 ， 
你 都 必须 在 它 前 面 加 一 个 $ 字 符 。 当 你 为 变量 赋值 时 ， 你 只 需要 使 用 变量 名 ， 该 变量 会 根据 需要 被 自 
动 创建 。 一 种 检查 变量 内 容 的 简单 方式 就 是 在 变量 名 前 加 一 个 $ 符 号 ， 再 用 echo 命 令 将 它 的 内 容 输出 
到 终端 上 。 





设计 能 力 了 。shell 是 
它 可 以 在 把 各 个 小 程序 段 组 合 为 一 个 大 程序 之 前 就 能 很 容易 地 对 它 
可 以 用 bash shell 编 写 出 相当 庞大 的 结构 化 程序 。 在 接 下 来 的 儿 节 里 ， 
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在 命令 行 上 ， 你 可 以 通过 设置 和 检查 变量 salutation 的 不 同 值 来 实际 查看 变量 的 使 用 ， 
$ salutation=Hello 

$ echo $salutation 

Hello 

$ salutation="Yes Dear" 

$ echo $salutation 

Yes Dear 

$ salutation=7+5 

$ echo $salutation 

7+5 





注意 ， 如 果 字 符 事 里 包含 空格 ， 就 必须 用 引号 把 它们 括 起 来 此 外 ， 等 号 两 边 不 能 有 
空格 . 


你 可 以 使 用 reaa 命 令 将 用 户 的 输入 赋值 给 一 个 变量 。 这 个 命令 需要 一 个 参数 ， 即 准备 读 入 用 户 输 
入 数据 的 变量 名 ， 然 后 它 会 等 待 用 户 输入 数据 。 通 常情 况 下 ， 在 用 户 按 下 回 车 键 时 ，reaa 命 令 结束 。 
当 从 终端 上 读 取 一 个 变量 时 ， 你 一 般 不 需要 使 用 引号 ， 如 下 所 示 : 

$ read salutation 

Wie geht's? 

$ echo $salutation 

Wie geht's? 


1. 使 用 引号 

在 继续 学 习 之 前 ， 你 先 需要 弄 清楚 shell 的 一 个 特点 ， 引 号 的 使 用 。 

- 般 情况 下 , 脚本 文件 中 的 参数 以 空白 字符 分 隔 (例如 ,一 个 空格 、 一 个 制 表 符 或 者 一 个 换行 符 )。 
如 果 你 想 在 一 个 参数 中 包含 一 个 或 多 个 空白 字符 ， 你 就 必须 给 参数 加 上 引号 。 

像 $f0o 这 样 的 变量 在 引号 中 的 行为 取决 于 你 所 使 用 的 引号 类 型 。 如 果 你 把 一 个 变量 表达 式 放 在 
双 引号 中 ， 程 序 执行 到 这 一 行 时 就 会 把 变量 替换 为 它 的 值 ， 如 果 你 把 它 放 在 单 引号 中 ， 就 不 会 发 生 替 
换 现象 ， 你 还 可 以 通过 在 $ 字 符 前 面 加 上 一 个 \ 字 符 以 取消 它 的 特殊 含义 。 

字符 申通 常 都 被 放 在 双 引号 中 ， 以 防止 变量 被 空白 字符 分 开 ， 同 时 又 允许 $ 扩 展 。 


实验 变量 的 使 用 


这 个 例子 显示 了 引号 在 变量 输出 中 的 作用 : 
V1 /bin/sh 








myvar-"Hi there" 


echo $myvar 

echo *$myvar* 
echo '$myvar' 
echo \Smyvar 


echo Enter some text 
read myvar 


echo '$myvar' now equals $myvar 
exit 0 
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输出 结果 如 下 : 

$ ./variable 

Hi there 

Hi there 

$myvar 

$myvar 

Enter some text 

Hello World 

$myvar now equals Hello World 


实验 解析 

变量 myvar 在 创建 时 被 赋值 字符 串 Hi chere。 你 用 echo 命 令 显示 该 变量 的 内 容 ， 同 时 显示 了 在 变 
量 名 前 加 一 个 $ 符 号 就 能 得 到 变量 的 内 容 。 你 看 到 使 用 双 引 号 并 不 影响 变量 的 替换 ， 但 使 用 单 引号 和 
反 斜 线 就 不 进行 变量 的 替换 。 你 还 使 用 reaa 命 令 从 用 户 那里 读 入 一 个 字符 串 。 





2. 环境 变量 

当 一 个 shell 脚 本 程序 开始 执行 时 ， 一 些 变量 会 根据 环境 设置 中 的 值 进行 初始 化 。 这 些 变量 通常 用 
大 写字 母 做 名 字 ， 以 便 把 它们 和 用 户 在 脚本 程序 里 定义 的 变量 区 分 开 来 ， 后 者 按 惯例 都 用 小 写字 母 做 
名 字 。 具 体 创建 的 变量 取决 于 你 的 个 人 配置 。 在 系统 的 使 用 手册 中 列 出 了 许多 这 样 的 环境 变量 , 表 2-2 
列 出 了 其 中 一 些 主要 的 变量 。 








表 2-2 

环境 变量 i A 

SHOME 当前 用 户 的 家 目录 

SPATH 以 冒号 分 隔 的 用 来 搜索 命令 的 目录 列表 

$PS1 命令 提示 符 , 通常 是 $ 字 符 , 但 在 bash 中 ， 你 可 以 使 用 一 些 更 复杂 的 值 。 例 如， 字符 囊 [Vugvh \w]$ 
就 是 一 个 流行 的 默认 值 ， 它 给 出 用 户 名 、 机 器 名 和 当前 目录 名 ， 当 然 也 包括 一 个 $ 提 示 符 

SPS2 -级 提示 符 ， 用 来 提示 后 续 的 输入 ， 通 常 是 > 字符 

$IFS 输入 域 分 隔 符 。 当 shell 读 取 输 入 时 ， 它 给 出 用 来 分 隔 单词 的 一 组 字符 ， 它 们 通常 是 空格 、 制 表 符 
和 换行 符 

$0 shell 脚 本 的 名 字 

Dad 传递 给 脚本 的 参数 个 数 

5$ shell 脚 本 的 进程 车， 脚本 程序 通常 会 用 它 来 生成 一 个 唯一 的 临时 文件 ， 如 /cmp/cmpfile_SS 








如 果 想 通过 执行 env <command> 命 令 来 查看 程序 在 不 同 环境 下 是 如 何 工作 的 ， 请 查 
阅 env 命 令 的 使 用 手册 。 你 也 将 在 本 章 的 后 面 看 到 如 何 使 用 export 命 令 在 子 shell 中 设置 环 
境 变量 。 


3. 参数 变量 

如 果 脚 本 程序 在 调用 时 带 有 参数 ， 一 些 额 外 的 变量 就 会 被 创建 。 即 使 没有 传递 任何 参数 ， 环 境 变 
量 s# 也 依然 存在 ， 只 不 过 它 的 值 是 0 罢了 。 

参数 变量 见 表 2-3。 
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* 23 
参数 变量 说 明 
81. 82, ... 脚本 程序 的 参数 
s 在 一 个 变量 中 列 出 所 有 的 参数 , 各 个 参数 之 间 用 环境 变量 IFs 中 的 第 一 个 字符 分 是 开 。 如 果 TFS 
被 修改 了 ， 那 么 s* 将 命令 行 分 割 为 参数 的 方式 就 将 随 之 改变 

se 它 是 $* 的 一 种 精巧 的 变 体 ， 它 不 使 用 Fs 环 境 变量 ， 所 以 即使 zs 为 空 ， 参 数 也 不 会 挤 在 -起 
通过 下 面 的 例子 ， 你 可 以 很 容易 地 看 出 Se 和 s* 之 间 的 区 别 ; 

$ IF 

$ set foo bar bam 

$ echo "$@" 


foo bar bam 
$ echo "$*" 
foobarbam 

$ unset IFS 
$ echo "$*" 
foo bar bam 


如 你 所 见 ， 双 引号 里 面 的 $e 把 各 个 参数 扩展 为 彼此 分 开 的 域 ， 而 不 受 IFs 值 的 影响 ， 一 般 来 说 ， 
如 果 你 想 访问 脚本 程序 的 参数 ， 使 用 $e 是 明智 的 选择 。 
除了 使 用 echo 命 令 查 看 变量 的 内 容 外 ， 你 还 可 以 使 用 reaa 命 令 来 读 取 它们 。 


RE 使 用 参数 和 环境 变量 


下 面 的 脚本 程序 演示 了 一 些 简单 的 变量 操作 。 当 输入 脚本 程序 的 内 容 并 把 它 保存 为 文件 cry_var 
后 ， 别 忘 了 用 chmod «x try_var 命 令 把 它 设置 为 可 执行 。 
M1 /bin/sh 


salutation="Hello" 

echo $salutation 

echo "The program $0 is now running" 
echo "The second parameter was $2" 

echo "The first parameter was $1" 

echo "The parameter list was $** 

echo "The user's home directory is SHOME" 


echo "Please enter a new greeting" 
read salutation 


echo $salutation 
echo "The script is now complete* 
exit 0 


运行 这 个 脚本 程序 ， 你 将 得 到 如 下 所 示 的 输出 结果 : 
$ ./try var foo bar baz 

Hello 

The program ./try var is now running 

The second parameter was bar 

The first parameter was foo 

The parameter list was foo bar baz 
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The user's home directory is /home/rick 
Please enter a new greeting 

Sire 

Sire 

The script is now complete 


实验 解析 
这 个 脚本 程序 创建 变量 salutation 并 显示 它 的 内 容 , 然后 显示 各 种 参数 变量 以 及 环境 变量 $HOME 
都 已 存在 并 有 了 适当 的 值 。 
我 们 将 在 后 面 进一步 介绍 参数 亚 换 。 





2.6.2 ”条件 

所 有 程序 设计 的 基础 是 对 条 件 进行 测试 判断 ， 并 根据 测试 结果 采取 不 同行 动 的 能 力 。 在 讨论 它 
之 前 ， 我 们 先 来 看 看 在 shell 脚 本 程序 里 可 以 使 用 的 条 件 结构 ， 然 后 再 来 看 看 使 用 这 些 条 件 的 控制 结构 。 

一 个 shell 脚 本 能 够 对 任何 可 以 从 命令 行 上 调用 的 命令 的 退出 码 进行 测试 ， 其 中 也 包括 你 自己 编写 的 
脚本 程序 ,这 也 就 是 为 什么 要 在 所 有 自己 编写 的 脚本 程序 的 结尾 包括 一 条 返回 值 的 exit 命 令 的 重要 原因 。 

test 或 [命令 

在 实际 工作 中 ， 大 多 数 脚本 程序 都 会 广泛 使 用 shell 的 布尔 判断 命令 [或 cest。 在 一 些 系 统 上 ， 这 
两 个 命令 的 作用 是 一 样 的 ， 只 是 为 了 增强 可 读 性 ， 当 使 用 [命令 时 ， 我 们 还 使 用 符号 ] 来 结 。 把 [ 符 
号 当 作 一 条 命令 多 少 有 点 奇怪 ， 但 它 在 代码 中 确实 会 使 命令 的 语法 看 起 来 更 简单 、 更 明确 、 更 像 其 他 
的 程序 设计 语言 。 

在 一 些 老 版 本 的 UNIX shell 中 ， 这 些 命令 调用 的 是 一 个 外 部 程序 ， 但 在 较 新 的 shell 版 
本 中 , 它们 已 成 为 shell 的 内 置 命令 . 我 们 将 在 本 章 后 面 介绍 各 种 命令 时 再 次 讨论 这 个 问题 

因为 est 命 令 在 shell 脚 本 程序 以 外 用 得 很 少 , 所 以 那些 很 少 编写 shell 脚 本 的 Linux 用 户 
往往 会 将 自己 编写 的 简单 程序 命名 为 Lest。 如 果 程 序 不 能 正常 工作 ， 很 可 能 是 因为 它 与 
shell 中 的 cest 命 令 发 生 了 冲突 . 要 想 查看 系统 中 是 否 有 一 个 指定 名 称 的 外 部 命令 ， 你 可 以 
尝试 使 用 which test 这 样 的 命令 来 检查 执行 的 是 哪 一 个 test 命 令 ， 或 者 使 用 ./test 这 种 
执行 方式 以 确保 你 执行 的 是 当前 目录 下 的 脚本 程序 。 如 有 疑问 ， 你 只 需 养 成 在 调用 脚本 的 
前 面 加 上 ./ 的 习惯 即 可 


我 们 以 一 个 最 简单 的 条 件 为 例 来 介绍 test 命 令 的 用 法 : 检查 一 个 文件 是 否 存 在 。 用 于 实现 这 一 操 
作 的 命令 是 cest -f <filename>， 所 以 在 脚本 程序 里 ， 你 可 以 写 出 如 下 所 示 的 代码 : 


if test -f fred.c 
then 




















H 
你 还 可 以 写成 下 面 这 样 : 


it [ -f fred.c ] 
then 


fi 
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test 命 令 的 退出 码 (表明 条 件 是 否 被 满足 ) 决定 是 否 需 要 执行 后 面 的 条 件 代码 。 


注意 ， 你 必须 在 [符号 和 被 检查 的 条 件 之 间 留 出 空格 . 要 记 住 这 一 点 ， 你 可 以 把 [符号 
看 作 和 test 命 令 一 样 ， 而 test 命 令 之 后 总 是 应 访 有 一 个 空格 . 

如 果 你 喜欢 把 then 和 if 放 在 同一 行 上 ， 就 必须 要 用 一 个 分 号 把 Lest 语 句 和 then 分 隔 
开 。 如 下 所 示 : 

if [ -f fred.c ]; then 





fi 











test 命 令 可 以 使 用 的 条 件 类 型 可 以 归 为 3 类 : 字符 串 比较 、 算术 比较 和 与 文件 有 关 的 条 件 测试 ， 
表 2-4、 表 2-5 和 表 2-6 描 述 了 这 3 种 条 件 类 型 。 


表 24 
字符 串 比较 s R k 





stringl = string2 如 果 两 个 字符 串 相 同 则 结果 为 真 
stringl != string2 如 果 两 个 字符 囊 不 同 则 结果 为 真 
-n string 如 果 字符 串 不 为 空 则 结果 为 真 


-2 string 如 果 字符 囊 为 nul11〈 一 个 空 囊 )》 则 结果 为 真 
一 1 Cm MA» 
表 2-5 

算术 比较 s om 





expressionl -eq expression 如 果 两 个 表达 式 相等 则 结果 为 真 

expressionl -ne expression2 如 果 两 个 表达 式 不 等 则 结果 为 真 

expressionl -gt expression2 如 果 expression1 大 于 expression2 则 结果 为 真 
expressionl -ge expression2 如 果 expressicn1 大 于 等 于 expression2 则 结果 为 真 
expressionl -lt expression2 如 果 expression1 小 于 expression2 则 结果 为 真 
expression! -le expression2 如 果 expressionl 小 于 等 于 expression2 则 结果 为 真 


! expression 如 果 表 达 式 为 假 则 结果 为 真 ， 反 之 亦 然 
一 
表 2-6 

文件 条 件 测试 5 R 





-à file 如 果 文 件 是 一 个 目录 则 结果 为 真 

-e file 如 果 文 件 存在 则 结果 为 真 。 要 注意 的 是 ， 历 史上 -e 选 项 不 可 移植 ， 所 以 
通常 使 用 的 是 -+ 选项 

-f file 如 果 文件 是 一 个 普通 文件 则 结果 为 真 

-g file 如 果 文件 的 sec-group-id 位 被 设置 则 结果 为 真 

-r file 如 果 文 件 可 读 则 结果 为 真 

-s file 如 果 文件 的 大 小 不 为 0 则 结果 为 真 

u file 如 果 文 件 的 set -user-ia 位 被 设置 则 结果 为 真 

-w file 如 果 文 件 可 写 则 结果 为 真 


-x file dn RC PETAT RIA ONU C 
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读者 可 能 想 知道 什么 是 set -group-iG 和 set-user-id (也 叫做 set -gidfeset-uid) 
位 。set-uid 位 授予 了 程序 其 拥有 者 的 访问 权限 而 不 是 其 使 用 者 的 访问 权限 ， 而 set -gid 
位 授予 了 程序 其 所 在 组 的 访问 权限 。 这 两 个 特殊 位 是 通过 chmoa 命 令 的 选项 s 和 gi 设置 的 
set-qid 和 set-uia 标 志 对 shell 脚 本 程序 不 起 作用 ， 它 们 只 对 可 执行 的 二 进 制 文件 有 用 。 


我 们 稍微 超前 了 一 些 ,但 是 接 下 来 的 测试 /bin/bash 文 件 状态 的 例子 可 以 让 你 看 出 如 何 使 用 它们 : 
$1 /bin/sh 











if [ -f /bin/bash ] 
then 

echo "file /bin/bash exists" 
fi 


if [ -d /bin/bash ] 
then 

echo "/bin/bash is a directory" 
else 

echo "/bin/bash is NOT a directory* 
fi 


各 种 与 文件 有 关 的 条 件 测试 的 结果 为 真 的 前 提 是 文件 必须 存在 。 上 述 列 表 仅仅 列 出 了 cest 命 令 比 
较 常用 的 选项 ， 完 整 的 选项 清单 请 查阅 它 的 使 用 手册 。 如 果 你 使 用 的 是 bash， 那 么 test 命 令 是 shell 的 
内 置 命令 ， 使 用 help test 命 令 可 以 获得 test 命 令 更 详细 的 信息 。 我 们 将 在 本 章 后 面 用 到 这 里 给 出 的 


部 分 选项 。 
现在 你 已 学 习 了 “条 件 ” 下 面 你 将 看 到 使 用 它们 的 控制 结构 。 
2.6.3 控制 结构 





shell 有 一 组 控制 结构 ， 它 们 与 其 他 程序 设计 语言 中 的 控制 结构 很 相似 。 


在 下 面 的 各 小 节 中 ， 各 语句 的 语法 中 的 statements 表 示 when、while 或 until 测 试 条 
件 满足 时 ， 将 要 执行 的 一 系列 命令 - 


1. if 语 名 
if 语 句 非常 简单 : 它 对 某 个 命令 的 执行 结果 进行 测试 , 然后 根据 测试 结果 有 条 件 地 执行 一 组 语句 。 
如 下 所 示 : 
if condition 
then 
statements 














eise 
statements 
fi 


[E NETT 


if 语 句 的 一 个 常见 用 法 是 提 一 个 问题 ， 然 后 根据 回答 作出 决定 ， 如 下 所 示 : 
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#!/bin/sh 


echo "Is it morning? Please answer yes or no" 
read timeofday 


if [ $timeofday = "yes* ]; then 
echo "Good morning" 

else 

echo "Good afternoon" 

fi 


exit 0 


这 将 给 出 如 下 所 示 的 输出 : 

Is it morning? Please answer yes or no 
yes 

Good morning 

$ 


这 个 脚本 程序 用 [命令 对 变量 cimeofaay 的 内 容 进行 测试 ， 测 试 结果 由 if 命令 判断 ， 由 它 来 决定 
执行 哪 部 分 代码 。 


请 注意 ,你 用 额外 的 空白 符 来 缩 进 i 结构 内 部 的 语句 。 这 只 是 为 了 照顾 人 们 的 阅读 习 
惯 ，shell 会 恕 略 这 些 多 余 的 空白 符 . 


2. elif 语 句 

过 全 的 是 ， 上 面 这 个 非常 简单 的 脚本 程序 存在 几 个 问题 。 其 中 一 个 问题 是 ， 它 会 把 所 有 不 是 yes 
的 回答 都 看 做 是 no。 你 可 以 通过 使 用 elif 结 构 来 避免 出 现 这 样 的 情况 ， 它 允 许 你 在 if 结构 的 else 部 
分 被 执行 时 增加 第 二 个 检查 条 件 。 


EE 用 oli 结构 做 进 一 步 检查 


你 可 以 对 上 面 的 脚本 程序 做 些 修改 ， 让 它 在 用 户 输 入 yes 或 no 以 外 的 其 他 任何 数据 时 报告 一 条 出 
错 信息 。 这 是 通过 将 el se 替换 为 el if 并 且 增 加 另 一 个 测试 条 件 的 方法 来 完成 的 。 


#!/bin/sh 

















echo "Is it morning? Please answer yes or no" 
read timeofday 


if [ $timeofday = 'yes* ] 
then 
echo "Good morning* 


elif [ $timeofday = "no" ]; then 
echo "Good afternoon" 

else 
echo *Sorry, $timeofday not recognized. Enter yes or no* 
exit 1 

fi 


exit 0 
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这 个 脚本 程序 与 上 一 个 例子 很 相似 , 但 新 增 的 elif 命 令 会 在 第 一 个 if 条 件 不 满足 的 情况 下 进一步 
测试 变量 。 如 果 两 次 测试 的 结果 都 不 成 功 ， 就 打印 一 条 出 错 信息 并 以 1 为 退出 码 结束 脚本 程序 ， 调 用 
者 可 以 在 调用 程序 中 利用 这 个 退出 码 来 检查 脚本 程序 是 否 执行 成 功 。 





3. 一 个 与 变量 有 关 的 问题 

刚才 所 做 的 修改 弥补 了 一 个 非常 明显 的 缺陷 ， 但 这 个 脚本 程序 还 潜藏 着 一 个 更 隐蔽 的 问题 。 运 行 
这 个 新 的 脚本 程序 ， 但 是 这 次 不 回答 问题 ， 而 是 直接 按 下 回 车 键 (或 是 某 些 键 盘 上 的 Return 键 )。 你 将 
看 到 如 下 所 示 的 出 错 信息 ; 

I: 

哪里 出 问题 了 呢 ? 问题 就 在 第 一 个 if 语句 中 。 在 对 变量 cimeofaay 进 行 测试 的 时 候 ， 它 包含 一 个 
空 字符 串 ， 这 使 得 if 语 名 成 为 下 面 这 个 样子 : 

if (= "yes" ] 
而 这 不 是 一 个 合法 的 条 件 。 为 了 避免 出 现 这 种 情况 ， 你 必须 给 变量 加 上 引号 ， 如 下 所 示 ， 

if [ "$timeofday* = "yes" ] 

这 样 ， 一 个 空 变量 提供 的 就 是 一 个 合法 的 测试 了 : 

if [ "* = "yes" ] 

新 脚本 程序 如 下 所 示 : 


#!/bin/sh 





unary operator expected 





echo "Is it morning? Please answer yes or no" 
read timeofday 


if [ "$timeofday* = "yes" ] 
then 
echo "Good morning" 
elif [ "Stimeofday" = "no" ]; then 
echo "Good afternoon" 
else 
echo "Sorry, $timeofday not recognized. Enter yes or no" 
exit 1 
fi 


exit 0 


这 个 脚本 对 用 户 直接 按 下 回 车 键 来 回答 问题 的 情况 也 能 够 应 付 自如 了 。 


如 果 你 想 让 echo 命 令 去 挤 每 一 行 后 面 的 换行 符 ， 可 移植 性 最 好 的 办 法 是 使 用 printf 
命令 (请 见 本 章 后 面 的 printf 一 节 ) 而 不 是 echo 命 令 。 有 的 shell 用 echo-e 命 令 来 完成 这 
一 任务 ,但 并 不 是 所 有 的 系统 都 支持 该 命令 ，bash 使 用 echo-n 命 令 来 去 除 换行 符 ， 所 以 如 
果 确 信 自己 的 脚本 程序 只 运行 在 bash 上 ， 你 就 可 以 使 用 如 下 的 语法 : 














echo -n "Is it morning? Please answer yes or no: " 
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请 注意 ， 你 需要 在 结束 引号 前 留 出 一 个 额外 的 空格 ， 这 使 得 在 用 户 输入 响应 前 有 一 个 间 
阶 ， 从 而 看 起 来 更 加 整洁 。 
4. for 语 句 
我 们 可 以 用 for 结 构 来 循环 处 理 一 组 值 ， 这 组 值 可 以 是 任意 字符 串 的 集合 。 它 们 可 以 在 程序 里 被 
列 出 ， 更 常见 的 做 法 是 使 用 shell 的 文件 名 扩展 结果 。 
它 的 语法 很 简单 : 


for variable in values 
do 

statements 
done 


实验 使 用 固定 字符 串 的 for 循 环 


循环 值 通常 是 字符 串 ， 所 以 你 可 以 这 样 写 程序 ， 
#!/bin/sh 


for foo in bar fud 43 
do 


该 程序 的 输出 结果 如 下 所 示 : 
bar 

fud 

43 





如 果 你 把 第 一 行 由 for foo in bar fud 43 修 改 为 for foo in "bar fud 43" 会 怎 
样 呢 ? 别 忘 了 ， 加 上 引号 就 等 于 告诉 shell 把 引号 之 间 的 一 切 东西 都 看 作 是 一 个 字符 串 。 这 
是 在 变量 里 保留 空格 的 一 种 办 法 。 


实验 解析 
这 个 例子 创建 了 一 个 变量 foo， 然 后 在 for 循 环 里 每 次 给 它 赋 一 个 不 同 的 值 。 因 为 shell 在 默认 情况 
下 认为 所 有 变量 包含 的 都 是 字符 串 ， 所 以 字符 串 43 在 使 用 中 与 字符 串 fua 是 一 样 合法 有 效 的 。 


实验 | 使 用 通配符 扩展 的 for 循 环 


正如 我 们 前 面 所 提 到 的 ，for 循 环 经 常 与 shell 的 文件 名 扩展 一 起 使 用 。 这 意味 着 在 字符 串 的 值 中 
使 用 一 个 通配符 ， 并 由 shell 在 程序 执行 时 填写 出 所 有 的 值 。 

你 已 经 在 最 早 的 first 例 子 中 见 过 这 种 做 法 了 。 该 脚本 程序 用 shell 扩 展 把 * 扩 展 为 当前 目录 中 所 有 
文件 的 名 字 ， 然 后 它们 依次 作为 for 循 环 中 的 变量 $file 使 用 。 

我 们 来 快速 地 看 看 另外 一 个 通配符 扩展 的 例子 。 假 设 你 想 打印 当前 目录 中 所 有 以 字母 E 开 头 的 脚 
本 文件 ， 并 且 你 知道 自己 的 所 有 脚本 程序 都 以 .sh 结尾 ， 你 就 可 以 这 样 做 : 
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*!/bin/sh 


for file in $(1s f*.sh); do 
lpr $file 

done 

exit 0 


这 个 例子 演示 了 $ (command) 语法 的 用 法 , 我 们 将 在 后 面 的 内 容 中 对 它 做 更 详细 地 介绍 (参见 2.6.6 
节 )。 简 单 地 说 ，for 命 令 的 参数 表 来 自 括 在 $ () 中 的 命令 的 输出 结果 
shell 扩 展 f* . sh 给 出 所 有 匹配 此 模式 的 文件 的 名 字 。 





请 记 住 ，shell 脚 本 程序 中 所 有 的 变量 扩展 都 是 在 脚本 程序 被 执行 时 而 不 是 在 编写 它 时 


完成 的 所以， 变量 声明 中 的 语法 错误 只 有 在 执行 时 才 会 被 发 现 ， 就 像 前 面 我 们 给 空 变量 
加 引号 的 例子 中 看 到 的 那样 。 














5. whlie 语 句 

因为 在 默认 情况 下 ， 所 有 的 shell 变 量 值 都 被 认为 是 字符 串 ， 所 以 for 循环 特别 适合 于 对 一 系列 字 
符 串 进行 循环 处 理 ， 但 如 果 你 事先 并 不 知道 循环 要 执行 的 次 数 ， 那 么 它 就 显得 不 是 那么 有 用 了 。 

如 果 需 要 重复 执行 一 个 命令 序列 ， 但 事先 又 不 知道 这 个 命令 序列 应 该 执行 的 次 数 ， 你 通常 会 使 用 
-个 while 循 环 ， 它 的 语法 如 下 所 示 : 

while condition do 


statements 
done 


请 看 下 面 的 例子 ， 这 是 一 个 非常 简陋 的 密码 检查 程序 : 
#1/bin/sh 


echo "Enter password" 
read trythis 


while [ "$trythis" != "secret" ]; do 
echo "Sorry, try again" 
read trythis 

done 

exit 0 


这 个 脚本 程序 的 一 个 输出 示例 如 下 所 示 : 
Enter password 

password 

Sorry, try again 

secret 

$ 


很 明显 ， 这 不 是 一 种 询问 密码 的 非常 安全 的 办 法 ， 但 它 确实 演示 了 while 语 句 的 作用 。ao 和 adcne 


之 间 的 语句 将 反复 执行 ， 直 到 条 件 不 再 为 真 。 在 这 个 例子 中 ， 你 检查 的 条 件 是 变量 crythis 的 值 是 否 


等 于 secret。 循 环 将 一 直 执 行 直 到 $trythis 等 于 secret。 随 后 你 将 继续 执行 脚本 程序 中 紧 跟 在 done 
后 面 的 语句 。 
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6. until 语 句 
until 语 句 的 语法 如 下 所 示 : 
until condition 
do 

statements 
done 


它 与 while 循 环 很 相似 ， 只 是 把 条 件 测试 反 过 来 了 。 换 句 话说 ， 循 环 将 反复 执行 直到 条 件 为 真 ， 
而 不 是 在 条 件 为 真 时 反复 执行 。 


一 般 来 说 ， 如 果 需 要 循环 至 少 执行 一 次 ， 那 么 就 使 有 while 循环; 如 果 可 能 根本 都 不 
需要 执行 循环 ， 就 使 用 until 循 环 . 


下 面 是 一 个 unti1 循 环 的 例子 ， 你 设置 一 个 警报 ， 当 某 个 特定 的 用 户 登录 时 ， 该 警报 就 会 启动 ， 
你 通过 命令 行将 用 户 名 传递 给 脚本 程序 。 如 下 所 示 ; 
1 /bin/bash 














until who | grep "$1" > /dev/null 
do 

Sleep 60 
done 


# now ring the bell and announce the expected user. 


echo -e '\a' 
echo ***** $1 has just logged in ***** 


exit 0 


如 果 用 户 已 经 登录 ， 那 么 循环 就 不 需要 执行 。 所 以 在 这 种 情况 下 ， 使 用 unti1 语 句 比 使 用 while 
语句 更 自然 。 
7. case 语 句 
case 结 构 比 你 目前 为 止 见 过 的 其 他 结构 都 要 稍微 复杂 一 些 。 它 的 语法 如 下 所 示 ， 
case variable in 
pattern [ | pattern] ...) statements;; 
pattern [ | pattern] ...) statements;; 
esac 
这 看 上 去 有 些 令 人 生生 , 但 case 结 构 允 许 你 通过 一 种 比较 复杂 的 方式 将 变量 的 内 容 和 模式 进行 匹 
配 ， 然 后 再 根据 匹配 的 模式 去 执行 不 同 的 代码 。 这 要 比 使 用 多 条 if、elif 和 else 语 句 来 执行 多 个 条 
件 检查 要 简单 得 多 。 
请 注意 , 每 个 模式 行 都 以 双 分 号 ( ;; ) 结尾 . 因为 你 可 以 在 前 后 模式 之 间 放 置 多 条 语句 ， 
所 以 需要 使 用 一 个 双 分 号 来 标记 前 一 个 语句 的 结束 和 后 一 个 模式 的 开始 。 
因为 case 结 构 具备 匹配 多 个 模式 然后 执行 多 条 相关 语句 的 能 力 , 这 使 得 它 非常 适合 于 处 理 用 户 的 
输入 。 弄 明白 case 工 作 原 理 的 最 好 方法 就 是 通过 例子 来 进行 说 明 。 我 们 将 使 用 3 个 实验 例子 逐步 深入 
地 对 它 进行 介绍 ， 每 次 都 对 模式 匹配 进行 改进 。 
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你 在 case 结 构 的 模式 中 使 用 如 * 这 样 的 通配符 时 要 小 心 。 因 为 case 将 使 用 第 一 个 匹配 
的 模式 ， 即 使 后 续 的 模式 有 更 加 精确 的 匹配 也 是 如 此 - 








| | case 示 例 一 : 用 户 输入 
你 可 以 用 case 结 构 编写 一 个 新 版 的 输入 测试 脚本 程序 , 让 它 更 具 选择 性 并 且 对 非 预 期 输入 也 更 宽 


容 : 


#!/bin/sh 


echo "Is it morning? Please answer yes or no" 
read timeofday 


case "$timeofday* in 


yes) 
no) 
Y) 
n) 
- 


esac 


exit 0 


echo 
echo 
echo 
echo 
echo 


Mcash f BEBATIM, CARER c imeotaay ll KASR PERRETE. RNF 
与 输入 匹配 成 功 ，case 命 令 就 会 执行 紧 随 右 括号 ) 后 面 的 代码 ， 然 后 就 结束 。 
case 命 令 会 对 用 来 做 比较 的 字符 串 进行 正常 的 通配符 扩展 , 因此 你 可 以 指定 字符 串 的 一 部 分 并 在 


其 后 加 上 一 个 * 通 配 符 。 只 使 用 一 个 单独 的 * 表 示 
符 串 之 后 再 加 上 一 个 * 以 确保 如 果 没 有 字符 串 得 到 匹配 ，case 语 句 也 会 执行 某 个 默认 动作 。 之 所 以 能 


"Good Morning*;; 





"Sorry, answer not T EA O i 


任何 可 能 的 字符 串 ， 所 以 我 们 总 是 在 其 他 匹 二 





够 这 样 做 是 因为 case 语 句 是 按 顺序 比较 每 一 个 字符 串 ， 它 不 会 去 查找 最 佳 匹 配 ， 而 仅仅 是 查找 第 一 个 
匹配 。 因为 默认 条 件 通常 都 是 些 “最 不 可 能 出 现 ” 的 条 件 ， 所 以 使 用 * 对 脚本 程序 的 调试 很 有 帮助 。 





RE cast: 合并 匹配 模式 





上 面 例子 中 的 case 结 构 明 显 比 多 个 if 语句 的 版 本 更 精致 ， 但 通过 合并 匹配 模式 ， 你 可 以 编写 一 个 
更 加 清晰 的 版 本 。 如 下 所 示 : 


#!/bin/sh 


echo "Is it morning? Please answer yes or no" 
read timeofday 


case "$timeofday" in 


yes | y | Yes | YES ) echo "Good Morning*;; 

nt | N* ) echo "Good Afternoon';; 

*) echo "Sorry, answer not recognized"; ; 
esac 
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这 个 脚本 程序 在 每 个 case 条 目 中 都 使 用 了 多 个 字符 串 , case 将 对 每 个 条 目 中 的 多 个 不 同 的 字符 串 
进行 测试 ， 以 决定 是 否 需 要 执行 相应 的 语句 。 这 使 得 脚本 程序 不 仅 长 度 变 短 ， 而 且 实 际 上 也 更 容易 阅 
读 。 这 个 脚本 程序 同时 还 显示 了 * 通 配 符 的 用 法 ， 虽 然 这 样 做 有 可 能 匹配 意料 之 外 的 模式 。 例 如 ， 如 
果 用 户 输入 never， 它 就 会 匹配 hn* 并 显示 出 Good Afternoon， 而 这 并 不 是 我 们 希望 的 行为 。 另 外 需要 
注意 的 是 * 通 配 符 扩展 在 引号 中 不 起 作用 。 








最 后 ， 为 了 让 这 个 脚本 程序 具备 可 重用 性 ， 你 需要 在 使 用 默认 模式 时 给 出 另外 一 个 退出 码 。 如 下 
所 示 : 


#!/bin/sh 


echo "Is it morning? Please answer yes or no" 
read timeofday 


case "$timeofday" in 
yes | y | Yes | YES ) 
echo "Good Morning" 
echo "Up bright and early this morning" 
[nN] *) 
echo "Good Afternoon" 
n 
iji 
echo "Sorry, answer not recognized" 
echo "Please answer yes or no" 
exit 1 


esac 


exit 0 

实验 解析 

为 了 演示 模式 匹配 的 不 同 用 法 ， 这 个 代码 改变 了 no 情况 下 的 匹配 方法 。 你 还 看 到 了 如 何在 case 
语句 中 为 每 个 模式 执行 多 条 语句 。 注 意 ， 你 必须 很 小 心地 把 最 精确 的 匹配 放 在 最 开始 ， 而 把 最 一 般 化 
的 匹配 放 在 最 后 。 这 样 做 很 重要 ， 因 为 case 将 执行 它 找到 的 第 一 个 匹配 而 不 是 最 佳 匹配 。 如 果 你 把 *) 
放 在 开头 ， 那 不 管用 户 输入 的 是 什么 ， 都 会 匹配 这 个 模式 。 

请 注意 ，esac 前 面 的 双 分 号 ( ;; ) 是 可 选 的 。 在 C 语 言 程序 设计 中 ， 即 使 少 一 个 break 
语句 都 算是 不 好 的 程序 设计 做 法 ,但 在 shell 程 序 设计 中 , 如 果 最 后 一 个 case 模 式 是 默认 模式 ， 
那么 省 略 最 后 一 个 双 分 号 ( ; ; ) 是 没有 问题 的 ， 因 为 后 面 没有 其 他 的 case 模 式 需要 考虑 了 ， 

为 了 让 case 的 匹配 功能 更 强大 ， 你 可 以 使 用 如 下 的 模式 : 
(yY) | [Yy] [Ee] [Ss] ) 
这 限制 了 允许 出 现 的 字母 ， 但 它 同时 也 允许 多 种 多 样 的 答案 并 且 提供 了 比 * 通 配 符 更 多 的 控制 。 
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8. 命令 列表 
有 时 ， 你 想 要 将 几 条 命令 连接 成 一 个 序列 。 例 如 ， 你 可 能 想 在 执行 某 个 语句 之 前 同时 满足 好 几 个 
不 同 的 条 件 ， 如 下 所 示 : 
if [ -f this file ]; then 
if [ -f that file ]; then 
if [ -f the other file ]; then 
echo "All files present, and correct" 
fi 
fi 
fi 
或 者 你 可 能 希望 至 少 在 这 一 系列 条 件 中 有 一 个 为 真 ， 像 下 面 这 样 : 
if [ -f this file ]; then 
foos*True" 
elif [ -£ that file ]; then 
foos'True* 
elif [ -f the other file ]; then 
fooz"True" 
else 
foo-"False" 
fi 
if [ "$foo" = "True* ]; then 
echo "One of the files exists" 
fi 
虽然 这 可 以 通过 使 用 多 个 if 语句 来 实现 ， 但 如 你 所 见 ， 写 出 来 的 程序 非常 笨拙 。shell 提 供 了 一 对 
特殊 的 结构 ， 专 门 用 于 处 理 命令 列表 ， 它 们 是 AND 列 表 和 OR 列 表 。 虽 然 它 们 通常 在 一 起 使 用 ， 但 我 
们 将 分 别 介绍 它们 的 语法 。 
© AND 列 表 
AND 列 表 结构 允许 你 按照 这 样 的 方式 执行 一 系列 命令 : 只 有 在 前 面 所 有 的 命令 都 执行 成 功 的 情况 
下 才 执行 后 一 条 命令 。 它 的 语法 是 : 
statementl && statement2 && statement3 && ... 
从 左 开始 顺序 执行 每 条 命令 ， 如 果 一 条 命令 返回 的 是 true， 它 右边 的 下 一 条 命令 才能 够 执行 。 如 
此 持续 直到 有 一 条 命令 返回 false， 或 者 列表 中 的 所 有 命令 都 执行 完毕 。&& 的 作用 是 检查 前 一 条 命令 
的 返回 值 。 
每 条 语句 都 是 独立 执行 ， 这 就 允许 你 把 许多 不 同 的 命令 混合 在 一 个 单独 的 命令 列表 中 ， 就 像 下 面 
的 脚本 程序 显示 的 那样 。AND 列 表 作为 一 个 整体 ， 只 有 在 列表 中 的 所 有 命令 都 执行 成 功 时 ， 才 算 它 执 
行 成 功 ， 否 则 就 算 它 失败 。 


实 验 AND 列 表 


在 下 面 的 脚本 程序 中 ， 你 执行 couch file_one 命 令 (检查 文件 是 否 存 在 ， 如 果 不 存在 就 创建 它 ) 
并 删除 file_two 文 件 。 然 后 用 AND 列 表 检查 每 个 文件 是 否 存 在 并 通过 echo 命 令 给 出 相应 的 指示 。 
#!/bin/sh 








touch file_one 
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rm -f file two 


if [ -f file one ] && echo "hello" && [ -f file two ] && echo " there" 
then 
echo "in if" 
else 
echo "in else" 
fi 


exit 0 


执行 这 个 脚本 程序 ， 你 将 看 到 如 下 所 示 的 结果 ; 
hell 
in else 


touch 和 rm 命令 确保 当前 目录 中 的 有 关 文 件 处 于 已 知 状态 。 然后 ss 列表 执行 [-f file_one] 语 句 ， 
这 条 语句 肯定 会 执行 成 功 ， 因 为 你 已 经 确保 该 文件 是 存在 的 了 。 因为 前 一 条 命令 执行 成 功 ， 所 以 echo 
命令 得 以 执行 ， 它 也 执行 成 功 echo 命令 总 是 返回 crue)。 当 执行 第 三 个 测试 [-f file_two] 时 ， 因 
为 该 文件 并 不 存在 ， 所 以 它 执行 失败 了 。 这 条 命令 的 失败 导致 最 后 一 条 echo 语 句 未 被 执行 。 而 因为 该 
命令 列表 中 的 一 条 命令 失败 了 ， 所 以 sg 列表 的 总 的 执行 结果 是 False， if 语 名 将 执行 它 的 else 部 分 。 


* OR 列表 

OR 列表 结构 允许 我 们 持续 执行 一 系列 命令 直到 有 一 条 命令 成 功 为 止 ， 其 后 的 命令 将 不 再 被 执行 。 
它 的 语法 是 : 

statementl || statement2 || statement3 I] we 

从 左 开始 顺序 执行 每 条 命令 。 如果 一 条 命令 返回 的 是 false, 它 右边 的 下 -条 命令 才能 够 被 执行 。 
如 此 持续 直到 有 一 条 命令 返回 crue， 或 者 列表 中 的 所 有 命令 都 执行 完毕 。 

11 列 表 和 && 列 表 很 相似 ， 只 是 继续 执行 下 一 条 语句 的 条 件 现在 变 为 其 前 一 条 语句 必须 执行 失败 。 


OR 列表 
沿用 上 一 个 例子 ， 但 要 修改 下 面 程序 清单 里 阴影 部 分 的 语句 ， 


#!/bin/sh 








rm -f file_one 


if [ -f file one ] || echo "hello" || echo * there" 
then 
echo "in if* 
else 
echo *in else* 
fi 


exit 0 


这 个 脚本 程序 的 输出 是 : 
hello 
in if 
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头 两 行 代码 简单 的 为 脚本 程序 的 剩余 部 分 设置 好 相应 的 文件 。 第 一 条 命令 1-f file_one] 失 败 了 ， 
因为 这 个 文件 不 存在 。 接 下 来 执行 echo 语 句 ， 它 返回 crue， 因此 11 列 表 中 的 后 续 命令 将 不 会 被 执行 ， 
因为 11 列 表 中 有 一 条 命令 (echo) 返回 的 是 crue， 所 以 if 语 句 执行 成 功 并 将 执行 其 chen 部 分 。 

这 两 种 结构 的 返回 结果 都 等 于 最 后 一 条 执行 语句 的 返回 结果 。 

这 些 列表 类 型 结构 的 执行 方式 与 C 语 言 中 对 多 个 条 件 进行 测试 的 执行 方式 很 相似 。 只 需 执 行 最 少 
的 语句 就 可 以 确定 其 返回 结果 。 不 影响 返回 结果 的 语句 不 会 被 执行 。 这 通常 被 称 为 短路 径 求 值 《short 
circuit evaluation) 

将 这 两 种 结构 结合 在 一 起 将 更 能 体现 逻辑 的 魅力 。 请 看 : 

{ -£ file one ] && command for true || command for false 

在 上 面 的 语句 中 ， 如 果 测 试 成 功 就 会 执行 第 一 条 命令 ， 否则 执行 第 二 条 命令 。 你 最 好 用 这 些 不 寻 
常 的 命令 列表 来 进行 实验 ， 但 在 通常 情况 下 ， 你 应 该 用 括号 来 强制 求 值 的 顺序 。 





9. 语句 块 
如 果 你 想 在 某 些 只 允许 使 用 单个 语句 的 地 方 (比如 在 AND 或 OR 列表 中 ) 使 用 多 条 语句 ， 你 可 以 
把 它们 括 在 花 括 号 (1 中 来 构造 一 个 语句 块 。 例 如 ， 在 本 章 后 面 给 出 的 应 用 程序 中 ， 你 将 看 到 如 下 所 示 
的 代码 : 
get_confirm && { 
grep -v "$cdcatnum" $tracks file > $temp_file 
cat $temp file » $tracks file 
echo 


add record tracks 
) 


26.4 函数 


你 可 以 在 shell 中 定义 函数 。 如 果 你 想 编写 大 型 的 shell 脚 本 程序 ， 你 会 想到 用 它们 来 构造 自己 的 代 
码 。 


作为 另 一 种 选择 ， 你 可 以 把 一 个 大 型 的 脚本 程序 分 成 许多 小 一 点 的 脚本 程序 ， 让 每 个 肢 
本 完成 一 个 小 任务 .但 这 种 做 法 有 几 个 缺点 : 在 一 个 脚本 程序 中 执行 另外 一 个 脚本 程序 要 比 
执行 一 个 函数 慢 得 多 ; 返回 执行 结果 变 得 更 加 困难 ， 而 且 可 能 存在 非常 多 的 小 脚本 ， 你 应 该 
考虑 自 己 的 脚本 程序 中 是 否 有 可 以 明显 的 单独 存在 的 最 小 部 分 ， 并 将 其 作为 是 否 应 将 一 个 大 
型 脚本 程序 分 解 为 一 组 小 脚本 的 衡量 尺度 。 


要 定义 一 个 shell 函 数 ， 你 只 需 写 出 它 的 名 字 ， 然 后 是 一 对 空 括号 ， 再 把 函数 中 的 语句 放 在 一 对 花 
插 号 中 ， 如 下 所 示 : 
function name () { 
statements 


) 


ze 一 个 简单 的 函数 


我 们 从 一 个 非常 简单 的 函数 开始 : 


40 ”第 2 章 shell 程 序 设计 





$1/bin/sh 


foo() ( 
echo "Function foo is executing* 
) 


echo "script starting" 
foo 
echo "script ended" 


exit 0 

运行 这 个 脚本 程序 会 显示 如 下 的 输出 信息 : 
script starting 

Function foo is executing 

script ending 


这 个 脚本 程序 还 是 从 自己 的 顶部 开始 执行 ， 这 一 点 与 其 他 脚本 程序 没什么 分 别 。 但 当 它 遇 见 
foo(){ 结 构 时 ， 它 知道 脚本 正在 定义 一 个 名 为 foo 的 函数 。 它 会 记 住 foo 代 表 着 一 个 函数 并 从 ) 字 符 之 
后 的 位 置 继续 执行 。 当 执行 到 单独 的 行 foo 时 ， shell 就 知道 应 该 去 执行 刚才 定义 的 函数 了 。 当 这 个 函 
数 执行 完毕 以 后 ， 执行 过 程 会 返回 到 调用 foo 函 数 的 那 条 语句 的 后 面 继续 执行 。 

你 必须 在 调用 一 个 函数 之 前 先 对 它 进行 定义 ， 这 有 点 像 Pascal 语 言 里 函数 必须 先 于 调用 而 被 定义 
的 概念 ， 只 是 在 shell 中 不 存在 前 向 声明 。 但 这 并 不 会 成 为 什么 问题 ， 因 为 所 有 脚本 程序 都 是 从 顶部 开 
始 执行 ， 所 以 只 要 把 所 有 函数 定义 都 放 在 任何 -个 函数 调用 之 前 ， 就 可 以 保证 所 有 的 函数 在 被 调用 之 
前 就 被 定义 了 。 

当 一 个 函数 被 调用 时 ， 脚 本 程序 的 位 置 参数 ($s*、s@、s#、s1、 $2 等 ) 会 被 替换 为 函数 的 参数 。 
这 也 是 你 读 取 传递 给 函数 的 参数 的 办 法 。 当 函数 执行 完毕 后 ， 这 些 参数 会 恢复 为 它们 先前 的 值 。 


一 些 老 版 本 的 shell 在 函数 执行 之 后 可 能 不 会 恢复 位 置 参数 的 值 。 所 以 如 果 你 想 让 自己 
的 脚本 程序 具备 可 移植 性 ， 就 最 好 不 要 依 环 这 一 行为. 


你 可 以 通过 xeturn 命 令 让 函数 返回 数字 值 ,让 函数 返回 字符 串 值 的 常用 方法 是 让 函数 将 字符 囊 保 
存在 一 个 变量 中 ， 该 变量 然后 可 以 在 函数 结束 之 后 被 使 用 。 此 外 ， 你 还 可 以 echo 一 个 字符 串 并 捕获 其 
结果 ， 如 下 所 示 : 


foo () ( echo JAY;) 

















result="$ (fo00)" 


请 注意 ， 你 可 以 使 用 1ocal 关 键 字 在 shell 函 数 中 声明 局 部 变量 ， 局 部 变量 将 仅 在 函数 的 作用 范围 
内 有 效 。 此 外 ， 函 数 可 以 访问 全 局 作用 范围 内 的 其 他 shell 变 量 。 如 果 一 个 局 部 变量 和 一 个 全 局 变量 的 
名 字 相同 ， 前 者 就 会 覆盖 后 者 ， 但 仅 限于 函数 的 作用 范围 之 内 。 例 如 ， 你 可 以 对 上 面 的 脚本 程序 进行 
如 下 的 修改 来 查看 执行 结果 : 


#!/bin/sh 


sample text-'global variable" 
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foo() ( 


local sample text-"local variable" 
echo "Function foo is executing" 
echo $sample text 


echo "script starting" 
echo $sample text 


echo "script ended" 
echo $sample text 


exit 0 
如 果 在 函数 里 没有 使 用 return 命 令 指定 一 个 返回 值 , 函数 返回 的 就 是 执行 的 最 后 一 条 命令 的 退出 
码 。 





实验 从 函数 中 返回 一 个 值 

下 一 个 脚本 程序 my_name 演 示 了 函数 的 参数 是 如 何 传递 的 ， 以 及 函数 如 何 返回 一 个 true 或 false 
值 。 你 使 用 一 个 参数 来 调用 该 脚本 程序 ， 该 参数 是 你 想 要 在 问题 中 使 用 的 名 字 。 

(1) 在 shell 头 之 后 ， 我 们 定义 了 函数 yes_or_no: 

#!/bin/sh 


yes.or no() { 
echo "Is your name $* ?" 





while true 
do 
echo -n "Enter yes or no: " 
read x 
case "$x" in 
y | ves ) return 0;; 
n |no) return 1;; 
ny echo "Answer yes or no* 
esac 
done 
) 
(2) 然后 是 主 程序 部 分 : 


echo "Original parameters are $** 


if yes or no "$1" 
then 
echo "Hi $1, nice name* 
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这 个 脚本 程序 的 典型 输出 如 下 所 示 ; 

$ ./my name Rick Neil 

Original parameters are Rick Neil 
Is your name Rick ? 

Enter yes or no: yes 

Hi Rick, nice name 


$ 

脚本 程序 开始 执行 时 ， 函 数 yes_or_no 被 定义 ， 但 先 不 会 执行 。 在 if 语句 中 ， 脚本 程序 执行 到 函 
数 yes_or_no 时 ， 先 把 $1 替换 为 脚本 程序 的 第 一 个 参数 Rick， 再 把 它 作为 参数 传递 给 这 个 函数 。 函 数 
将 使 用 这 些 参数 它们 现在 被 保存 在 $1、$2 等 位 置 参数 中 ) 并 向 调用 者 返回 一 个 值 。 if 结 构 再 根据 这 
个 返回 值 去 执行 相应 的 语句 。 

如 你 所 见 ，shell 有 着 丰 富 的 控制 结构 和 条 件 语句 。 接 下 来 ， 你 需要 学 习 一 些 shell 的 内 置 命令 ， 然 
后 你 就 要 在 不 使 用 编译 器 的 情况 下 解决 一 个 实际 的 程序 设计 问题 了 ! 





265 命令 


你 可 以 在 shell 脚 本 程序 内 部 执行 两 类 命令 。 一 类 是 可 以 在 命令 提示 符 中 执行 的 “普通 ”命令 ， 也 
称 为 外 部 命令 (exteral command)， 一 类 是 我 们 前 面 提 到 的 “内 置 ”命令 ， 也 称 为 内 部 命令 (internal 
command )。 内 置 命 令 是 在 shell 内 部 实现 的 ， 它 们 不 能 作为 外 部 程序 被 调用 。 然 而 ， 大 多 数 的 内 部 命令 
同时 也 提供 了 独立 运行 的 程序 版 本 一 一 这 一 需求 是 POSIX 规 范 的 一 部 分 。 通常 情况 下 ， 命 令 是 内 部 的 
还 是 外 部 的 并 不 重要 ， 只 是 内 部 命令 的 执行 效率 更 高 。 

我 们 在 这 里 将 只 介绍 那些 在 编写 脚本 程序 时 会 用 到 的 主要 命令 ， 不 分 内 部 还 是 外 部 。 作 为 一 个 
Linux 用 户 ， 你 可 能 还 知道 许多 其 他 可 以 在 命令 提示 符 下 执行 的 合法 命令 。 请 记 住 ， 除了 我 们 在 这 里 
介绍 的 内 置 命令 外 ， 它 们 同样 也 可 以 在 脚本 程序 中 使 用 。 

1. break 命 令 

你 可 以 用 这 个 命令 在 控制 条 件 未 满足 之 前 ， 跳 出 for、while 或 until 循 环 。 你 可 以 为 break 命 令 
提供 一 个 额外 的 数值 参数 来 表明 需要 跳出 的 循环 层 数 ， 但 我 们 并 不 建议 读者 这 么 做 ， 因 为 它 将 大 大 降 
低 程 序 的 可 读 性 。 在 默认 情况 下 ，break 只 跳出 一 层 循环 。 

#!/bin/sh 


rm -rf fred* 
echo » fredi 
echo > fred2 
mkdir fred3 
echo > fred4 


for file in fred* 
do 
if [ -d "$file* ]; then 
break; 
fi 
done 


echo first directory starting fred was $file 
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rm -rf fred* 
exit 0 


2. :命令 


HE CO 命令 是 一 个 空 命令 。 它 偶尔 会 被 用 于 简化 条 件 逻 辑 ， 相 当 于 true 的 一 个 别名 。 由 于 它 


是 内 置 命令 ， 所 以 它 运行 的 比 crue 快 ， 但 它 的 输出 可 读 性 较 差 。 


你 可 能 会 看 到 将 它 用 作 while 循 环 的 条 件 ，while :实现 了 一 个 无 限 循环 ， 代 替 了 更 常见 的 wnile 


true. 
: 结构 也 会 被 用 在 变量 的 条 件 设置 中 ， 例 如 : 


: $(var:svalue) 


如 果 没有 : ,shell 将 试图 把 Svar 当 作 一 条 命令 来 处 理 。 





在 一 些 shell 肢 本， 主要 是 一 些 旧 的 shell 脚 本 中 ， 你 可 能 会 看 到 置 号 被 用 在 一 行 的 开头 
来 表示 一 个 注释 。 但 现代 的 脚本 总 是 用 # 来 开始 一 个 注释 行 ， 因 为 这 样 做 执行 效率 更 高 。 








#!/bin/sh 


rm -f fred 
if [ -f fred ]; then 


else 
echo file fred did not exist 
fi 


exit 0 


3. continue $ 


非常 类 似 C 语 言 中 的 同名 语句 ， 这 个 命令 使 for、while 或 until 循 环 跳 到 下 一 次 循环 继续 执行 ， 


循环 变量 取 循环 列表 中 的 下 一 个 值 。 
#!/bin/sh 


rm -rf fred* 
echo > fredl 
echo > fred2 
mkdir fred3 
echo > fred4 


for file in fred* 
do 

if [ -d "$file" ]; then 

echo "skipping directory $file" 
continue 

fi 

echo file is $file 
done 


rm -rf fred* 
exit 0 
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continue 可 以 带 一 个 可 选 的 参数 以 表示 希望 继续 执行 的 循环 区 套 层 数 , 也 就 是 说 你 可 以 部 分 地 跳 
出 媒 套 循环 。 这 个 参数 很 少 使 用 ， 因 为 它 会 导致 脚本 程序 极 难 理解 。 例 如 : 
forxin123 
do 
echo before $x 
continue 1 


echo after $x 
done 


它 的 输出 是 : 
before 1 
before 2 
before 3 


4. .命令 
POCO 命令 用 于 在 当前 shell 中 执行 命令 : 
- /shell_script 


通常 ， 当 一 个 脚本 执行 一 条 外 部 命令 或 脚本 程序 时 ， 它 会 创建 一 个 新 的 环境 一 个 子 shell)， 命 
令 将 在 这 个 新 环境 中 执行 ， 在 命令 执行 完毕 后 ， 这 个 环境 被 丢弃 ， 留 下 退出 码 返回 给 父 shell。 但 外 部 
的 source 命 令 和 点 命令 (这 两 个 命令 差不多 是 同义词 ) 在 执行 脚本 程序 中 列 出 的 命令 时 ， 使 用 的 是 调 
用 该 脚本 程序 的 同一 个 shell。 

因为 在 默认 情况 下 ，shell 脚 本 程序 会 在 一 个 新 创建 的 环境 中 执行 ， 所 以 脚本 程序 对 环境 变量 所 作 
的 任何 修改 都 会 丢失 。 而 点 命令 允许 执行 的 脚本 程序 改变 当前 环境 。 当 你 要 把 一 个 脚本 当 作 "e" 
来 为 后 续 执行 的 一 些 其 他 命令 设置 环境 时 ， 这 个 命令 通常 就 很 有 用 。 例 如 ， 如 果 你 正 同时 参与 几 个 不 
同 的 项 目 ， 你 就 可 能 会 遇 到 需要 使 用 不 同 的 参数 来 调用 命令 的 情况 ， 比 如 说 调用 一 个 老 版 本 的 编译 器 
来 维护 一 个 旧 程 序 。 

在 shell 脚 本 程序 中 ， 点 命令 的 作用 有 点 类 似 于 C 或 CH+ 语 言 里 的 #include 指 令 。 尽管 它 并 没有 从 
字面 意义 上 包含 脚本 ， 但 它 的 确 是 在 当前 上 下 文中 执行 命令 ， 所 以 你 可 以 使 用 它 将 变量 和 函数 定义 结 
合 进 脚本 程序 。 


EW sose 0 


下 面 的 例子 在 命令 行 中 使 用 点 命令 ， 但 你 完全 可 以 把 它 用 在 一 个 脚本 程序 中 。 

(1) 假设 你 有 两 个 包含 环境 设置 的 文件 ， 它 们 分 别针 对 两 个 不 同 的 开发 环境 。 为 了 设置 老 的 、 经 
典 命令 的 环境 ， 你 可 以 使 用 文件 classic_set， 它 的 内 容 如 下 所 示 : 

#!/bin/sh 





version=classic 
PATH-/usr/1ocal/old bin:/usr/bin:/bin:. 
PSl-"classic» * 

(2) 对 于 新 命令 ， 使 用 文件 latest_set: 
#!/bin/sh 

version=latest 


PATH-/usr/local/new bin:/usr/bin:/bin:. 
PSl-* latest version» " 
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你 可 以 通过 将 这 些 脚本 程序 和 点 命令 结合 来 设置 环境 ， 就 像 下 面 的 示例 那样 : 


$ . ./classic set 

classic» echo $version 
classic 

classic» . /latest set 
latest version» echo $version 
latest 

latest version» 


实验 解析 
这 个 脚本 程序 使 用 点 命令 执行 ， 所 以 每 个 脚本 程序 都 是 在 当前 shell 中 执行 。 这 使 得 脚本 程序 可 以 
改变 当前 shell 中 的 环境 设置 ， 即 使 脚本 程序 执行 结束 后 ， 这 些 改变 仍然 有 效 。 








5. echo 命 令 

虽然 ，X/Open 建 议 在 现代 shell 中 使 用 printf 命 令 ， 但 我 们 还 是 依照 常规 使 用 echo 命 令 来 输出 结 
尾 带 有 换行 符 的 字符 串 。 

一 个 常见 的 问题 是 如 何 去 掉 换行 符 。 遗 悟 的 是 ， 不 同 版 本 的 UNIX 对 这 个 问题 有 着 不 同 的 解决 方 
法 。Linux 常 用 的 解决 方法 如 下 所 示 : 

echo -n "string to output" 
但 你 也 经 常会 遇 到 : 

echo -e "string to output|c* 

第 二 种 方法 echo -e 确 保 启用 了 反 斜 线 转 义 字符 《〈 如 \c 代 表 去 掉 换 行 符 ，\ 代 表 制 表 符 ，\n 代 表 
回 车 ) 的 解释 。 在 老 版 本 的 bash 中 ,对 反 斜 线 字符 的 解释 通常 都 是 默认 启用 的 , 但 最 新 版 本 的 bash 
通常 在 默认 情况 下 都 不 对 反 斜 线 转 义 字符 进行 解释 。 你 所 使 用 的 Linux 发 行 版 的 详细 行为 请 查看 相关 
手册 。 











如 果 你 需要 一 种 删除 结尾 换行 符 的 可 移植 方法 ， 则 可 以 使 用 外 部 命令 tr 来 删除 它 ， 但 
它 执行 的 速度 比较 慢 。 如果 你 需要 自己 的 脚本 兼容 UNIX 系 统 并 且 需要 删除 换行 符 ， 最 好 
坚持 使 用 printf 命 令 。 如 果 你 的 脚本 只 需要 运行 在 Linux 和 bash 上 ， 那 么 echo-n 是 不 错 的 
选择 , 虽然 你 可 能 需要 在 脚本 的 开头 加 上 #1! /bin/bash, 以 明确 表示 你 需要 bash 风 格 的 行为 。 


6. eval 命 令 

eval 命 令 允 许 你 对 参数 进行 求 值 。 它 是 shell 的 内 置 命令 ,通常 不 会 以 单独 命令 的 形式 存在 。 我 们 
借用 X/Open 规范 中 的 一 个 小 例子 来 演示 它 的 用 法 : 

foo=10 

x-foo 

y='$'$x 

echo $y 


它 输 出 stoo， 而 


foo=10 

x=foo 

eval yz'$'$x 
echo $y 
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输出 10。 因 此 ，eval 命 令 有 点 像 一 个 额外 的 $， 它 给 出 一 个 变量 的 值 的 值 。 

eval 命 令 十 分 有 用 ， 它 允许 代码 被 随时 生成 和 运行 。 虽然 它 的 确 增加 了 脚本 调试 的 复杂 度 ， 但 它 
可 以 让 你 完成 使 用 其 他 方法 难以 或 者 根本 无 法 完成 的 事情 。 

7. exec 命 令 

exec 命 令 有 两 种 不 同 的 用 法 。 它 的 典型 用 法 是 将 当前 shell 蔡 换 为 一 个 不 同 的 程序 。 例 如 : 

exec wall "Thanks for all the fish" 


脚本 中 的 这 个 命令 会 用 wall 命 令 替换 当前 的 shell。 脚本 程序 中 exec 命 令 后 面 的 代码 都 不 会 执行 ， 因 为 
执行 这 个 脚本 的 shell 已 经 不 存在 了 。 

exec 的 第 二 种 用 法 是 修改 当前 文件 描述 符 : 

exec 3« afile 

这 使 得 文件 描述 符 3 被 打开 以 便 从 文件 afile 中 读 取 数据 。 这 种 用 法 非常 少见 。 

8. exit n 命 令 

exit 命 令 使 脚本 程序 以 退出 码 n 结 束 运行 。 如 果 你 在 任何 一 个 交互 式 shell 的 命令 提示 符 中 使 用 这 
个 命令 ， 它 会 使 你 退出 系统 。 如 果 你 允许 自己 的 脚本 程序 在 退出 时 不 指定 一 个 退出 状态 ， 那么 该 肢 
本 中 最 后 一 条 被 执行 命令 的 状态 将 被 用 作为 返回 值 。 在 脚本 程序 中 提供 一 个 退出 码 总 是 一 个 良好 的 
习惯 。 

在 shell 脚 本 编程 中 ， 退 出 码 0 表示 成 功 ， 退出 码 1~125 是 脚本 程序 可 以 使 用 的 错误 代码 。 其 余数 字 
具有 保留 含义 ， 如 表 2-7 所 示 。 

表 27 





jB 出 码 说 m 
126 文件 不 可 执行 
127 命令 未 找到 
128 及 以 上 出 现 一 个 信号 


用 0 表示 成 功 对 于 许多 C/C++ 程序 员 来 说 可 能 有 些 不 寻常 .在 脚本 程序 中 , 这 种 做 法 的 -大 优点 是 : 
它 使 得 你 可 以 使 用 多 达 125 个 用 户 自 定义 的 错误 代码 ， 而 不 需要 使 用 一 个 全 局 的 错误 代码 变量 。 

下 面 是 一 个 简单 的 例子 ， 如 果 当 前 目录 下 存在 一 个 名 为 .profile 的 文件 ， 它 就 返回 0 表示 成 功 : 

M1 /bin/sh 

if [ -f .profile ]; then 


exit 0 
fi 


exit 1 

如 果 你 是 个 精益 求 精 的 人 , 或 至 少 追求 更 简洁 的 脚本 ， 那么 你 可 以 组 合 使 用 前 面 介绍 过 的 AND 和 
OR 列表 来 重 写 这 个 脚本 程序 ， 只 需要 一 行 代码 : 

[ -£ .profile ] && exit 0 || exit 1 

9. export 命 令 


export 命 令 将 作为 它 参数 的 变量 导出 到 子 shell 中 ， 并 使 之 在 子 shell 中 有 效 。 在 默认 情况 下 ， 在 一 
个 shell 中 被 创建 的 变量 在 这 个 shell 调 用 的 下 级 〈 子 ) shell 中 是 不 可 用 的 。 export 命 令 把 自己 的 参数 创 
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建 为 一 个 环境 变量 ， 而 这 个 环境 变量 可 以 被 当前 程序 调用 的 其 他 脚本 和 程序 看 见 。 从 更 技术 的 角度 米 
说 ， 被 导出 的 变量 构成 从 该 shell 衍 生 的 任何 子 进程 的 环境 变量 。 我 们 用 下 面 两 个 脚本 程序 export1 和 
export2 来 说 明 它 的 用 法 。 








(1) 我 们 先 列 出 脚本 程序 export2: 
#!/bin/sh 


echo "$foo* 
echo "$bar* 


(2) 然后 是 脚本 程序 export1。 在 这 个 脚本 的 结尾 ， 我 们 调用 了 export2: 
#1/bin/sh 


foo="The first meta-syntactic variable" 
export bar="The second meta-syntactic variable* 


export2 


如 果 你 运行 这 个 脚本 程序 ， 你 将 得 到 如 下 的 输出 : 
$ ./exporti 


The second meta-syntactic variable 


$ 

export2 脚 本 只 是 回 显 两 个 变量 的 值 。exporc1 脚 本 同时 设置 两 个 变量 ， 但 只 导出 变量 bar， 所 以 
当 它 其 后 调用 export2 时 ， 变 量 foo 的 值 已 丢失 ， 但 变量 bar 的 值 已 被 导出 到 第 二 个 脚本 中 。 脚 本 输出 
中 第 一 个 空 行 的 出 现 是 因为 sfoo 在 export2 中 没有 定义 ， 回 显 一 个 nul1 变 量 将 输出 一 个 空 行 。 

-日 一 个 变量 被 shell 导 出 ， 它 就 可 以 被 该 shell 调 用 的 任何 脚本 使 用 ， 也 可 以 被 后 续 依次 调用 的 任 
何 shell 使 用 。 如 果 脚 本 export2 调 用 了 另 一 个 脚本 ，bar 的 值 对 新 脚本 来 说 仍然 有 效 。 














set -a 或 set -allexport 命 令 将 导出 它 之 后 声明 的 所 有 变量 





10. expr 命 令 

expr 命 令 将 它 的 参数 当 作 一 个 表达 式 来 求 值 。 它 的 最 常见 用 法 就 是 进行 如 下 形式 的 简单 数学 运 
算 : 

x= expr $x + 1 

RIS CO 字符 使 x 取 值 为 命令 expr Sx + 1 的 执行 结果 。 你 也 可 以 用 语法 $ () 替换 反 引 号 `…， 
如 下 所 示 : 

x=$ (expr $x + 1) 


expr 命 令 的 功能 十 分 强大 ， 它 可 以 完成 许多 表达 式 求 值 计算 。 表 2-8 列 出 了 主要 的 一 些 求 值 计算 。 
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表达 式 求 值 





LEE 





expri | expr2 
exprl & expr2 


如 果 expr1 非 零 ， 则 等 于 exprl， 否 则 等 于 expr2 
只 要 有 一 个 表达 式 为 零 ， 则 等 于 零 ， 否 则 等 于 exprl 


expl = expr2 等 于 
expri > expr2 大 于 
exprl >= expr2 大 于 等 于 
expri < expr2 小 于 
expri <= expr2 小 于 等 于 
expri t= expr2 不 等 于 
exprl + expr2 加 法 
expri - expr2 减法 
expri * expr2 乘法 
exprl / expr2 整除 
expri $ expr2 rs 
在 较 新 的 脚本 程序 中 ，expr 命 令 通常 被 替换 为 更 有 效 的 $((. . .) ) 语 法 ， 这 个 我 们 会 在 本 章 后 面 


的 内 容 中 介绍 。 
11. printf 命 令 


只 有 最 新 版 本 的 shell 才 提供 printf 命 令 。X/Open 规 范 建议 我 们 应 该 用 它 来 代替 echo 命 令 ， 以 产 


生 格 式 化 的 输出 ， 但 看 来 几乎 没什么 人 接受 这 一 建议 。 


它 的 语法 是 : 


printf "format string" parameterl parameter2 ... 


格式 字符 串 与 C/C++ 中 使 用 的 非常 相似 ， 但 有 一 些 自己 的 限制 。 主 要 是 不 支持 浮 点 数 ， 因 为 shell 
中 所 有 的 算术 运算 都 是 按照 整数 来 进行 计算 的 。 格 式 字符 串 由 各 种 可 打印 字符 、 转 义 序列 和 字符 转换 


限定 符 组 成 。 格 式 字符 串 中 除了 % 和 \ 之 外 的 所 有 字符 都 将 按 原样 输出 。 





表 2-9 列 出 了 它 支 持 的 转 义 序列 。 
表 29 

转 义 序列 wo 明 
AR 双 引 号 
Mw 反射 线 字符 
bud 报警 〈 响 铃 或 蜂 鸣 ) 
Nb 退 格 字符 
Ne 取消 进一步 的 输出 
M 进 纸 换 页 字符 
\n 换行 符 
\r 回 车 符 
\t 制 表 符 
w 垂直 制 表 符 
ooo 八进制 值 coo 表 示 的 单个 字符 
Ve 十 六 进 制 值 az 表示 的 单个 字符 
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字符 转换 限定 符 相当 复杂 ， 所 以 我 们 在 这 里 只 列 出 最 常见 的 用 法 。 更 详细 的 介绍 可 以 参考 bash 的 
在 线 手册 或 printf 在 线 手册 的 第 一 部 分 (man 1 printf)。 如 果 在 手册 的 第 一 部 分 找 不 到 ， 你 可 以 尝 
试 查找 手册 的 第 三 部 分 。 字 符 转换 限定 符 由 一 个 s 和 和 跟 在 后 面 的 一 个 转换 字符 组 成 。 主 要 的 转换 字符 
如 表 2-10 所 示 。 





表 2-10 
字符 转换 限定 符 LEN] 
a 输出 一 个 十 进 制 数字 
c 输出 一 个 字符 
s ipu 
. 输出 一 个 % 字 符 


格式 字符 串 然后 被 用 来 解释 printf 后 续 参数 的 含义 并 输出 结果 。 例 如 : 

$ printf "*sin" hello 

hello 

$ printf "*s %d\t%s" "Hi There" 15 people 

Hi There 15 people 

注意 ， 你 必须 使 用 双 引 号 括 住 Hi There 字 符 串 ， 使 之 成 为 一 个 单独 的 参数 。 

12. return $ 

return 命 令 的 作用 是 使 函数 返回 。 我 们 在 前 面 介绍 函数 时 已 提 到 过 它 。return 命 令 有 一 个 数值 
参数 ， 这 个 参数 在 调用 该 函数 的 脚本 程序 里 被 看 做 是 该 函数 的 返回 值 。 如 果 没 有 指定 参数 ，return 
命令 默认 返回 最 后 一 条 命令 的 退出 码 。 

13. set 命 令 

set 命 令 的 作用 是 为 shell 设 置 参数 变量 。 许 多 命令 的 输出 结果 是 以 空格 分 隔 的 值 ， 如 果 需 要 使 用 
输出 结果 中 的 某 个 域 ， 这 个 命令 就 非常 有 用 。 

假设 你 想 在 一 个 shell 脚 本 中 使 用 当前 月 份 的 名 字 。 系 统 本 身 提 供 了 一 个 aace 命 令 ， 它 的 输出 结 
果 中 包含 了 字符 串 形式 的 月 份 名 称 , 但 是 你 需要 把 它 与 其 他 区 域 分 隔 开 。 你 可 以 将 set 命 令 和 $ (...) 
结构 相 结合 来 执行 Gate 命令， 并 且 返 回想 要 的 结果 。date 命 令 的 输出 把 月 份 字符 串 作为 它 的 第 二 个 
参数 ， 

41 /bin/sh 





echo the date is $(date) 
set $(date) 
echo The month is $2 


exit 0 


这 个 程序 把 qate 命 令 的 输出 设置 为 参数 列表 ， 然 后 通过 位 置 参数 $2 获得 月 份 . 

注意 , 我 们 以 date 命 令 作 为 一 个 简单 的 例子 来 说 明 怎么 提取 位 置 参数 。 由 于 Gate 命 令 的 输出 受 本 
地 语言 的 影响 较 大 ， 所 以 在 实际 工作 中 ， 你 应 该 使 用 date +%B 命 令 来 提取 月 份 名 字 。date 命 令 还 有 
许多 其 他 格式 选项 ， 详 细 资 料 请 参考 它 的 手册 页 。 

你 还 可 以 通过 set 命 令 和 它 的 参数 来 控制 shell 的 执行 方式 。 其 中 最 常用 的 命令 格式 是 set -x， 它 
让 一 个 脚本 程序 跟踪 显示 它 当 前 执行 的 命令 。 我 们 将 在 本 章 后 面 介绍 程序 调试 时 讨论 set 命 令 和 它 更 
多 的 选项 。 
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14. shift 命 令 
shift 命 令 把 所 有 参数 变量 左 移 一 个 位 置 ， 使 $2 变 成 s1，$3 变 成 s2， 以 此 类 推 。 原 来 $1 的 值 将 被 
丢弃 ， 而 $0 仍 将 保持 不 变 。 如 果 调 用 shi ft 命令 时 指定 了 一 个 数值 参数 ， 则 表示 所 有 的 参数 将 左 移 指 
定 的 次 数 。$*、$e 和 s$# 等 其 他 变量 也 将 根据 参数 变量 的 新 安排 做 相应 的 变动 。 
在 扫描 处 理 脚 本 程序 的 参数 时 ， 经 常 要 用 到 shift 命 令 。 如 果 你 的 脚本 程序 需要 10 个 或 10 个 以 上 
的 参数 ， 你 就 需要 用 shift 命 令 来 访问 第 十 个 及 其 后 面 的 参数 。 
例如 ， 你 可 以 像 下 面 这 样 依次 扫描 所 有 的 位 置 参 数 : 
#!/bin/sh 
while [ *$1* != ** ]; do 
echo "$1" 
shift 
done 


exit 0 


15. trap 命 令 

trap 命 令 用 于 指定 在 接收 到 信号 后 将 要 采取 的 行动 ， 我 们 将 在 本 书后 面 的 内 容 中 详细 介绍 信号 。 
trap 命 令 的 一 种 常见 用 途 是 在 脚本 程序 被 中 断 时 完成 清理 工作 .历史 上 , shell 总 是 用 数字 来 代表 信号 ， 
但 新 的 脚本 程序 应 该 使 用 信号 的 名 字 ， 它 们 定义 在 头 文件 signal .hb 中 ， 在 使 用 信号 名 时 需要 省 略 sTG 
前 级 。 你 可 以 在 命令 提示 符 下 输入 命令 crap -1 来 查看 信号 编号 及 其 关联 的 名 称 。 


对 于 那些 不 热 悉 信号 的 人 们 来 说 ， 信 号 是 指 那些 被 异步 发 送 到 一 个 程序 的 事件 在 默 
认 情 况 下 ， 它 们 通常 会 终止 一 个 程序 的 运行 。 


trap 命 令 有 两 个 参数 ,第 一 个 参数 是 接收 到 指定 信号 时 将 要 采取 的 行动 ,第 二 个 参数 是 要 处 理 的 
信号 名 。 

trap command signal 

请 记 住 ， 脚 本 程序 通常 是 以 从 上 到 下 的 顺序 解释 执行 的 ， 所 以 你 必须 在 你 想 保护 的 那 部 分 代码 之 
前 指定 trap 命 令 。 

如 果 要 重 置 某 个 信号 的 处 理 方式 到 其 默认 值 ， 只 需 将 commana 设 置 为 -。 如 果 要 忽略 某 个 信号 ， 就 
把 command 设 置 为 空 字符 串 ，…。 一 个 不 带 参数 的 crap 命 令 将 列 出 当前 设置 的 信号 及 其 行动 的 清单 。 

表 2-11 列 出 了 X/Open 规范 里 面 规定 的 能 够 被 捕获 的 比较 重要 的 一 些 信号 (括号 里 面 的 数字 是 对 应 
的 信号 编号 )。 更 多 细节 请 参考 signal 在 线 手册 的 第 7 部 分 (man 7 signal)。 

















表 2-11 
信 号 Ro 
HUP (1) 挂 起 ， 通 常 因 终端 掉 线 或 用 户 退 出 而 引发 
INT(2) 中 断 ， 通 常 因 按 下 Ctrl+C 组 合 键 而 引发 
QVIT(3) 人 退出， 通常 因 按 下 Ctrl\ 组 合 键 而 引发 
ABRT (6) 中 止 ， 通 常 因 某 些 严重 的 执行 错误 而 引发 
ALRM(14) 报警 ， 通 常用 来 处 理 超时 


TERM(15) 终止 ， 通 常 在 系统 关机 时 发 送 
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** 信号 处 理 


下 面 的 脚本 演示 了 一 些 简单 的 信号 处 理 方法 : 





41 /bin/sh 

trap 'rm -f /tmp/my tmp file $$' INT 

echo creating file /tmp/my tmp file $$ m 
date » /tmp/my tmp file $$ 


echo "press interrupt (CTRL-C) to interrupt 
while [ -f /tmp/my tmp file $$ ]; do 
echo File exists 
sleep 1 
done 
echo The file no longer exists 





trap INT 
echo creating file /tmp/my tmp file $$ 
date > /tmp/my tmp file $$ 


echo "press interrupt (control-C) to interrupt ...." 
while [ -f /tmp/my tmp file $$ ]; do 
echo File exists 


sleep 1 
done 
echo we never get here 
exit 0 
如 果 你 运行 这 个 脚本 ， 在 每 次 循环 时 按 下 Ctrit+C 组 合 键 或 任何 你 系统 上 设 定 的 中 断 键 )， 将 得 
到 如 下 所 示 的 输出 : 


creating file /tmp/my_cmp_file_141 

press interrupt (CTRL-C) to interrupt .... 
File exists 

File exists 

File exists 

File exists 

The file no longer exists 

creating file /tmp/my tmp file 14l 

press interrupt (CTRL-C) to interrupt .... 
File exists 

File exists 

File exists 

File exists 


在 这 个 脚本 程序 中 ， 我 们 先 用 crap 命 令 安排 它 在 出 现 一 个 INT 中断) 信号 时 执行 rm -E 
/tmp/my_tmp_file_$$ 命 令 删 除 临 时 文件 。 脚 本 程序 然后 进入 一 个 while 循 环 ， 只 要 临时 文件 存在 ， 
循环 就 一 直 持续 下 去 。 当 用 户 按 下 CtritC 组 合 键 时 ， 脚 本 程序 就 会 执行 rm -f /tmp/my_tmp_file_$$ 
语句 ， 然 后 继续 下 一 个 循环 。 因 为 临时 文件 现在 已 经 被 删除 了 ， 所 以 第 一 个 while 循 环 将 正常 退出 。 

接 下 来 ， 脚 本 程序 再 次 调用 trap 命 令 ， 这 次 是 指定 当 一 个 INT 信 号 出 现时 不 执行 任何 命令 。 脚 本 
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程序 然后 重新 创建 临时 文件 并 进入 第 二 个 while 循 环 。 这 次 当 用 户 按 下 CtrlHC 组 合 键 时 ， 没 有 语句 被 
指定 执行 ， 所 以 采取 默认 处 理 方式 ， 即 立即 终止 脚本 程序 。 因 为 脚本 程序 被 立即 终止 了 ， 所 以 最 后 的 
echo 和 exit 语 句 永远 都 不 会 被 执行 。 





16. unset 命 令 

unset 命 令 的 作用 是 从 环境 中 删除 变量 或 函数 。 这 个 命令 不 能 删除 shell 本 身 定义 的 只 读 变 量 (如 
IFS)。 这 个 命令 并 不 常用 。 

下 面 的 脚本 第 一 次 输出 字符 串 Hello worla， 但 第 二 次 只 输出 一 个 换行 符 ; 

#!/bin/sh 


foo="Hello World* 
echo $foo 


unset foo 
echo $foo 





使 用 foo0= 语 身 产生 的 效果 与 上 面 脚本 中 的 unset 命 令 产生 的 效果 差不多 ,但 并 不 等 同 . 
fo0= 语 向 将 变量 foo 设置 为 空 ， 但 变量 foo 仍 然 存 在 ， 而 使 用 unset foo 语 句 的 效果 是 把 变 
量 foo 从 环境 中 删除 。 


17. 另外 两 个 有 用 的 命令 和 正则 表达 式 

在 学 习 如 何 应 用 shell 编 程 中 的 这 个 新 知识 点 之 前 ， 让 我 们 再 来 看 另外 两 个 非常 有 用 的 命令 ， 它 们 
虽然 不 是 shell 的 一 部 分 ， 但 在 编写 shell 程 序 时 经 常用 到 。 同 时 ， 我 们 也 将 介绍 正则 表达 式 ， 一 种 出 现 
在 所 有 Linux 以 及 与 之 关联 程序 中 的 模式 匹配 特征 。 

© find 命 令 

你 将 看 到 的 第 一 个 命令 是 fina。 这 是 个 用 于 搜索 文件 的 命令 ， 它 极其 有 用 ， 但 Linux 初 学 者 常常 
觉得 它 不 易 使 用 ， 这 不 仅仅 是 因为 它 有 选项 、 测 试 和 动作 类 型 的 参数 ， 还 因为 其 中 一 个 参数 的 处 理 结 
果 可 能 会 影响 到 后 续 参数 的 处 理 。 

在 深入 研究 这 些 选项 、 测 试 和 参数 之 前 ， 让 我 们 首先 看 一 个 非常 简单 的 例子 ， 它 用 来 在 本 地 机 器 
上 查找 名 为 cest 的 文件 。 为 了 确保 你 具有 搜索 整个 机 器 的 权限 ， 请 以 root 用 户 身份 来 执行 这 个 命令 ; 

# find / -name test -print 


/usr/bin/test 
+ 


根据 你 所 使 用 系统 的 不 同 , 你 可 能 还 会 找到 其 他 几 个 名 称 也 为 cest 的 文件 正如 你 可 能 猜测 的 那样 ， 
这 个 命令 的 含义 是 : 从 根 目录 开始 查找 名 为 rest 的 文件 ， 并 且 输出 该 文件 的 完整 路 径 。 这 非常 简单 。 

然而 ， 这 个 命令 的 执行 确实 需要 花费 很 长 的 时 间 ， 并 且 网 络 上 的 Windows 机 器 的 硬盘 也 会 高 速 转 
动 .这 是 因为 Linux 机 器 挂 载 (使 用 AMBA) 了 一 大 块 Windows 机 器 的 文件 系统 , 看 起 来 似乎 是 Windows 
文件 系统 也 被 搜索 了 ， 尽 管 我 们 知道 要 查找 的 文件 应 该 在 Linux 机 器 上 。 

这 就 是 我 们 要 介绍 的 第 一 个 选项 发 挥 作用 的 时 候 了 。 如 果 你 指定 -mount 选 项, 你 就 可 以 告诉 fina 
命令 不 要 搜索 挂 载 的 其 他 文件 系统 的 目录 。 


* find / -mount -name test -print 
/usr/bin/test 
+ 
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我 们 仍然 能 找到 文件 ， 但 这 次 搜索 速度 会 更 快 ， 同 时 也 不 必 再 搜索 挂 载 的 其 他 文件 系统 。 

find 命 令 的 完整 语法 格式 如 下 所 示 : 

find [path] [options] [tests] [actions] 

path 部 分 很 容易 理解 :你 既 可 以 使 用 绝对 路 径 ， 如 /bin， 也 可 以 使 用 相对 路 径 ， 如.。 如 果 需 要 ， 
你 也 可 以 指定 多 个 路 径 ， 如 find /var /home. 

find 命 令 有 许多 选项 可 用 ， 表 2-12 列 出 了 一 些 主要 的 选项 。 








表 212 
选 项 * x 
"depth 在 查看 目录 本 身 之 前 先 搜索 日 录 的 内 容 
-follow 跟随 符号 链接 
-maxdepths N 最 多 搜索 N 层 目录 
-mount (或 -xdev) 不 搜索 其 他 文件 系统 中 的 目录 





下 面 是 测试 部 分 。 可 以 提供 给 find 命 令 的 测试 非常 多 ， 每 种 测试 返回 的 结果 有 两 种 可 能 :true 
或 false。fina 命 令 开始 工作 时 ， 它 按照 顺序 将 定义 的 每 种 测试 依次 应 用 到 它 搜索 到 的 每 个 文件 上 。 
如 果 一 个 测试 返回 false，fina 命 令 就 停止 处 理 它 当前 找到 的 这 个 文件 ， 并 继续 搜索 。 如 果 一 个 测试 
返回 true，fina 命 令 将 继续 下 一 个 测试 或 对 当前 文件 采取 行动 。 表 2-13 只 列 出 了 最 常用 的 测试 ， 请 参 
考 find 命 令 的 手册 页 以 了 解 所 有 可 以 使 用 的 测试 。 

















表 2-13 
a $ x 
-atime N 文件 在 N 天 之 前 被 最 后 访问 过 
mtime N 文件 在 N 天 之 前 被 最 后 修改 过 
name pattern 文件 名 (不 包括 路 径 名 ) 匹 配 提供 的 模式 pattern, 为 了 确保 pattern 被 传递 给 fina 
命令 而 不 是 由 shell 来 处 理 ，pattern 必 须 总 是 用 引号 括 起 
-newer otherfile 文件 比 ocherfile 文 件 要 新 
-type c 文件 的 类 型 为 c<，c 是 一 个 特殊 类 型 。 最 常见 的 是 a 目录) 和 f〔 普 通 文件 )。 其 他 
可 用 的 类 型 请 参考 手册 页 
-user username 文件 的 拥有 者 是 指定 的 用 户 username 
你 还 可 以 用 操作 符 来 组 合 测试 。 大 多 数 操作 符 有 两 种 格式 ， 短 格式 和 长 格式 ， 如 表 2-14 所 示 。 
表 2-14 
操作 符 ， 短 格式 操作 符 ， 长 格式 含 x 
! E 测试 取 反 
-a -and 两 个 测试 都 必须 为 真 
o -or 两 个 测试 有 一 个 必须 为 真 





你 可 以 通过 使 用 圆 括号 来 强制 测试 和 操作 符 的 优先 级 。 由 于 圆 括号 对 shell 来 说 有 其 特殊 的 含义 ， 
所 以 你 还 必须 使 用 反 斜 线 来 引用 圆 括号 。 此 外 ， 如 果 你 在 文件 名 处 使 用 的 是 匹配 模式 ， 你 就 必须 在 模 
式 上 使 用 引号 以 确保 模式 没有 被 shell 扩 展 , 而 是 直接 传递 给 fina 命 令 。 例 如 ,如果 你 想 写 一 个 测试 “ 搜 
索 的 文件 比 文件 X 要 新 ， 或 者 文件 名 以 下 划 线 开头 ”你 可 以 这 样 写 : 
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\(-newer X -o -name * ** \) 


我 们 将 在 下 一 个 “实验 解析 ”部 分 之 后 举 这 样 一 个 例子 。 


Ey 使 用 带 测试 的 fina 命 令 


在 当前 目录 下 搜索 比 文件 while2 要 新 的 文件 : 


$ find . -newer while2 -print 


/elif3 

./words. txt 

- /words2. txt 

./_trap 

$ 

这 个 结果 看 起 来 不 错 ， 不 过 在 结果 中 还 包括 了 当前 目录 ， 而 这 并 不 是 你 想 要 的 ， 你 只 对 普通 文件 
感 兴趣 。 所 以 你 会 增加 一 个 额外 的 测试 -type £: 

$ find . -newer while2 -type f -print 

/elif3 

/words, txt. 

» /words2.txt 

./_trap 


实验 解析 

它 是 如 何 工作 的 呢 ? 你 指定 fina 命 令 应 该 在 当前 目录 COO. 中 搜索 比 文件 while2 要 新 的 文件 
C-newer while2)， 如 果 这 个 测试 通过 ， 然 后 再 测试 这 个 文件 是 否 是 一 个 普通 文件 ( -type f)。 最 后 
你 使 用 前 面 已 经 讲 过 的 -print 来 确认 搜索 到 的 文件 。 

现在 来 查找 以 下 划 线 开头 的 文件 或 比 while2 文 件 要 新 的 文件 ， 但 在 两 种 情况 下 都 必须 是 普通 文 
件 。 这 个 例子 将 演示 如 何 使 用 圆 括号 来 对 测试 进行 组 合 

$ find . \( -name "_** -or -newer while2 X) -type f -print 

/elif3 

- /words.txt 

./words2.txt 

«/ break 

EE 

./.set 

./_shift 

/trap 

./.unset 

./-until 

$ 


可 以 看 出 完成 这 个 任务 并 不 是 很 困难 。 你 必须 转 义 圆 括号 使 得 它们 不 会 被 shell 处 理 ， 而 且 还 需要 
将 * 号 用 引号 括 起 使 得 它 被 直接 传递 给 fina 命 令 。 

现在 你 已 可 以 可 靠 地 搜索 文件 了 。 下 面 来 看 看 在 发 现 匹配 指定 条 件 的 文件 之 后 ， 你 可 以 执行 的 动 
作 。 表 2-15 只 列 出 了 最 常见 的 动作 ， 完 整 的 动作 列表 请 见 fina 命 令 的 手册 页 。 

-exec 和 -ok 命令 将 命令 行 上 后 续 的 参数 作为 它们 参数 的 一 部 分 ， 直 到 被 \; 序 列 终止 。 实 际 上 
-exec 和 -ok 命令 执行 的 是 一 个 嵌入 式 命令 ， 所 以 嵌入 式 命令 必须 以 一 个 转 义 的 分 号 结束 ， 使 得 ftina 
命令 可 以 决定 什么 时 候 它 可 以 继续 查找 用 于 它 自己 的 命令 行 选项 。 魔术 字符 申 () 是 -exec 或 -ok 命令 


e X 
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的 一 个 特殊 类 型 的 参数 ， 它 将 被 当前 文件 的 完整 路 径 取代 。 








表 2-15 
动作 *& x 

-exec command 执行 一 条 命令 。 这 是 最 常见 的 动作 之 一 。 请 见 这 个 表格 之 后 的 解释 以 了 解 参 数 是 如 何 
传道 给 这 个 命令 的 。 这 个 动作 必须 使 用 \; 字 符 对 来 结束 

-ok command 与 -exec 类 似 ， 但 它 在 执行 命令 之 前 会 针对 每 个 要 处 理 的 文件 ， 提 示 用 户 进行 确认 。 
这 个 动作 必须 使 用 \; 字 符 对 来 结束 

print 打印 文件 名 

-ls 对 当前 文件 使 用 命令 1s-ail 





上 面 的 解释 可 能 并 不 容易 理解 ， 但 通过 一 个 例子 可 以 将 其 解释 得 更 清楚 。 我 们 来 看 一 个 比较 简单 
的 例子 ， 它 使 用 一 条 非常 安全 的 命令 1s: 


$ find . -newer while2 -type f -exec ls -1 () V; 


-rwxr-xr-x 1 rick rick 275 Feb 8 17:07 ./elif3 
-rwxr-xr-x — 1 rick rick 336 Feb 8 16:52 ./words.txt 
-rwxr-xr-x — 1 rick rick 1274 Feb 8 16:52 ./worás2.txt 
-rwxr-xr-x 1 rick rick 504 Feb 8 18:43 ./ trap 


$ 
如 你 所 见 ，fina 命 令 非常 有 用 。 你 只 需 通过 一 点 练习 就 可 以 很 好 地 掌握 它 。 无 论 如 何 ， 这 点 练习 
是 完全 值得 的 ， 所 以 请 使 用 fina 命 令 来 进行 实验 。 





9 grep 命 令 

我 们 将 介绍 的 第 二 个 非常 有 用 的 命令 是 grep, 这 个 不 寻常 的 名 字 代表 的 是 通用 正则 表达 式 解析 器 
General Regular Expression Parser， 简 写 为 grep)。 你 使 用 find 命 令 在 系统 中 搜索 文件 ， 而 使 用 grep 
命令 在 文件 中 搜索 字符 串 。 事 实 上 ， 一 种 非常 常见 的 用 法 是 在 使 用 fina 命 令 时 ， 将 grep 作 为 传递 给 
-exec 的 一 条 命令 。 

grep 命 令 使 用 一 个 选项 、 一 个 要 匹配 的 模式 和 要 搜索 的 文件 ， 它 的 语法 如 下 所 示 : 

grep [options] PATTERN [FILES] 

如 果 没 有 提供 文件 名 ， 则 grep 命 令 将 搜索 标准 输入 。 

我 们 首先 来 查看 grep 命 令 的 一 些 主要 选项 ,它们 列 在 了 表 2-16 中 ， 完 整 的 选项 列表 请 见 grep 命 令 
的 手册 页 。 








表 2-16 
Xo 项 含 x 
* 输出 匹配 行 的 数目 ， 而 不 是 输出 匹配 的 行 
zE 启用 扩展 表达 式 
ki 取消 每 个 输出 行 的 普通 前 级 ， 即 匹配 查询 模式 的 文件 名 
忽略 大 小 写 
4 只 列 出 包含 匹配 行 的 文件 名 ， 而 不 输出 真正 的 匹配 行 
< 有 对 匹配 模式 取 反 ， 即 搜索 不 匹配 行 而 不 是 匹配 行 








EE 基本 的 grep 命 令 用 法 


我 们 来 看 一 些 使 用 grep 命 令 的 简单 例子 : 
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$ grep in words.txt 

When shall we three meet again. In thunder, lightning, or in rain? 
I come, Graymalkin! 

$ grep -c in words.txt words2.txt 

words.txt:2 

words2.txt:14 

$ grep -c -v in words.txt words2.txt 

words.txt:9 

words2.txt:16 


第 一 个 例子 未 使 用 选项 ， 它 只 是 在 文件 vords.txt 中 搜索 字符 串 in， 然 后 输出 匹配 的 行 。 文 件 名 
未 输出 是 因为 你 只 在 一 个 文件 中 进行 搜索 。 

第 二 个 例子 在 两 个 不 同 的 文件 中 计算 匹配 行 的 数目 。 在 这 种 情况 下 ， 文 件 名 被 输出 。 

最 后 一 个 例子 使 用 -v 选 项 对 搜索 取 反 ， 在 两 个 文件 中 计算 不 匹配 行 的 数目 。 





e 正则 表达 式 

正如 你 所 看 到 的 , grep 命 令 的 基本 用 法 非常 容易 掌握 。 现 在 是 时 候 介绍 正则 表达 式 的 基础 知识 了 ， 
它 允 许 你 实现 更 复杂 的 匹配 。 正 如 我 们 在 本 章 前 面 提 到 的 那样 ， 正则 表达 式 被 广泛 应 用 于 Linux 和 许 
多 其 他 开源 编程 语言 中 。 你 可 以 在 vi 编辑 器 或 Perl 脚 本 中 使 用 它们 ， 而 且 不 论 它们 出 现在 哪里 ， 其 基 
本 原理 都 是 一 样 的 。 

在 正则 表达 式 的 使 用 过 程 中 ， 一些 字符 是 以 特定 方式 处 理 的 。 最 常 使 用 的 特殊 字符 如 表 2-17 所 示 。 


表 2-17 
一 一 -~ 
字 符 3 x 


* 指向 一 行 的 开头 

s 指向 一 行 的 结尾 

. 任意 单个 字符 

n 方 括号 内 包含 一 个 字符 范围 ， 其 中 任何 一 个 字符 都 可 以 被 匹配 ， 例 如 字符 范围 a~e， 或 在 字符 
范围 前 面 加 上 ^ 符 号 表示 使 用 反 向 字符 范围 ， 即 不 匹配 指定 范围 内 的 字符 


如 果 想 将 上 述 字符 用 作 普 通 字符 ， 就 需要 在 它们 前 面 加 上 \ 字 符 。 例 如 ， 如 果 想 使 用 s 字 符 ， 你 需 

















要 将 它 写 为 \$。 
在 方 括号 中 还 可 以 使 用 一 些 有 用 的 特殊 匹配 模式 ， 如 表 2-18 所 示 。 
X 2-18 

匹配 模式 含 x 
[:alnum:] 字母 与 数字 字符 
[salpha:] 字母 
(:ascii:] ASCII 字 符 
[:blank:] 空格 或 制 表 符 
[sentrl:] ASCII 控 制 字符 
[:digit:] 数字 
I:graph:] 非 控制 、 非 空格 字符 
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(x 








a x 
小 写字 母 
可 打印 字符 
标点 符号 字符 
空白 字符 ， 包 括 垂直 制 表 符 
大 写字 母 
:xdigit:] 十 六 进 制 数字 
另外 ， 如 果 指定 了 用 于 扩展 匹配 的 -E 选 项 ， 那 些 用 于 控制 匹配 完成 的 其 他 字符 可 能 会 遵循 正则 表 
达 式 的 规则 〈 见 表 2-19)。 对 于 grep 命 令 来 说 ， 我 们 还 需要 在 这 些 字符 之 前 加 上 \ 字 符 。 
表 2-19 
选 项 & x 
? 匹配 是 可 选 的 ， 但 最 多 匹配 一 次 
必须 匹配 0 次 或 多 次 

















* 必须 匹配 1 次 或 多 次 

in) 必须 匹配 nm 次 

(n) 必须 匹配 n 次 或 n 次 以 上 

{nm} 匹配 次 数 在 n 到 m 之 间 ， 包 括 n 和 m 


这 看 上 去 有 点 复杂 ， 但 如 果 你 实际 应 用 它 ， 将 会 发 现 它 并 不 像 第 一 眼看 上 去 那么 复杂 。 掌 握 正 则 
表达 式 的 最 简单 方法 就 是 尝试 一 些 实验 。 

(0) 我 们 的 第 一 个 例子 是 查找 以 字母 e 结 尾 的 行 。 你 可 能 会 猜 到 需要 使 用 特殊 字符 $， 如 下 所 示 : 

$ grep e$ words2.txt 

Art thou not, fatal vision, sensible 

1 see thee yet, in form as palpable 

Nature seems dead, and wicked dreams abuse 





如 你 所 见 ， 这 个 命令 找到 了 以 字母 e 结 尾 的 行 。 

(2) 现在 假设 想 要 查找 以 字母 a 结 尾 的 单词 。 要 完成 这 一 任务 ， 你 需要 使 用 方 括号 括 起 的 特殊 严 配 
字符 。 在 本 例 中 ， 你 将 使 用 的 是 [[:blank:]]， 它 用 来 测试 空格 或 制 表 符 : 

$ grep al[:blank:]] words2.txt 

Is this a dagger which I see before me, 

A dagger of the mind, a false creation, 

Moves like a ghost. Thou sure and firm-set earth, 


$ 

(3) 下 面 我 们 来 查找 以 Th 开头 的 由 3 个 字母 组 成 的 单词 。 在 本 例 中 ， 你 既 需 要 使 用 [[:space:]] 来 
划 定 单词 的 结尾 ， 还 需要 用 字符 〈. ) 来 匹配 一 个 额外 的 字符 : 

$ grep Th.[[:space:]] words2.txt 

The handle toward my hand? Come, let me clutch thee 

The curtain'd sleep; witchcraft celebrates 


Thy very stones prate of my whereabout, 
E 
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(4) 最 后 ， 我 们 用 扩展 grep 模 式 来 搜索 只 有 10 个 字符 长 的 全 部 由 小 写字 母 组 成 的 单词 。 我 们 通过 
指定 一 个 匹配 字母 = 到 z 的 字符 范围 和 一 个 重复 10 次 的 匹配 来 完成 这 一 任务 : 

$ grep -E [a-z]\{10\} words2.txt 

Proceeding from the heat-oppressed brain? 

And such an instrument I was to use. 

The curtain'd sleep; witchcraft celebrates 

Thy very stones prate of my whereabout, 


我 们 在 这 里 只 涉及 了 正则 表达 式 中 最 重要 的 内 容 。 与 Linux 中 大 多 数 事物 一 样 ， 系 统 中 的 大 量 文 
档 可 以 帮助 你 了 解 更 多 的 细节 ， 但 学 习 正 则 表达 式 最 好 的 方法 是 实际 操作 。 


2.60.0 ”命令 的 执行 


编写 脚本 程序 时 ， 你 经 常 需要 捕获 一 条 命令 的 执行 结果 ， 并 把 它 用 在 shell 脚 本 程序 中 。 也 就 是 说 ， 
你 想 要 执行 一 条 命令 ， 并 把 该 命令 的 输出 放 到 一 个 变量 中 。 

你 可 以 用 在 本 章 前 面 set 命 令 示例 中 介绍 的 $ (commana) 语 法 来 实现 ， 也 可 以 用 一 种 比较 老 的 语法 
形式 `commana'`， 这 种 用 法 目前 依然 很 常见 。 


请 注意 ， 在 脚本 程序 里 执行 命令 的 比较 老 的 语法 形式 时 ， 使 用 的 是 反 引 号 CO ， 而 
不 是 我 们 在 前 面 使 用 的 单 引 号 C) ( 单 引号 的 作用 是 防止 变量 扩展 ) 。 只 有 当 你 需要 使 
自己 的 脚本 程序 具备 非常 好 的 可 移植 性 时 ， 你 才 应 该 使 用 这 种 比较 老 的 方法 。 


所 有 的 新 脚本 程序 都 应 该 使 用 $(. . .) 形 式 , 引入 这 一 形式 的 目的 是 为 了 避免 在 使 用 反 引号 执行 合 
令 时 ， 处 理 其 内 部 的 $、、、\ 等 字符 所 需要 应 用 的 相当 复杂 的 规则 。。 如 果 在 反 引号 `. . ,` 结 构 中 需要 用 
到 反 引 号 ， 它 就 必须 通过 \ 字 符 进行 转 义 。 这 些 相对 蜂 涩 的 字符 往往 会 让 程序 员 感到 困惑 ， 有 时 即使 
是 经 验 丰富 的 shell 脚 本 程序 员 也 必须 反复 进行 实验 ， 才 能 确保 在 反 引号 命令 中 引号 的 使 用 不 会 出 错 。 

$ (command) 的 结果 就 是 其 中 命令 的 输出 。 注 意 ， 这 不 是 该 命令 的 退出 状态 ， 而 是 它 的 字符 串 形 
式 的 输出 结果 。 例 如 : 

#!/bin/sh 














echo The current directory is $PWD 
echo The current users are $ (who) 


exit 0 


因为 当前 目录 是 一 个 shell 环 境 变量 ， 所 以 程序 的 第 一 行 不 需要 使 用 这 个 命令 执行 结构 。 但 如 果 我 
们 想 要 在 脚本 程序 中 使 用 who 命 令 的 输出 结果 ， 就 需要 使 用 这 个 结构 。 
如 果 想 要 将 命令 的 结果 放 到 一 个 变量 中 ， 你 可 以 按 通常 的 方法 来 给 它 赋值 ， 如 下 所 示 : 


whoisthere=$ (who) 
echo $whoisthere 


这 种 把 命令 的 执行 结果 放 到 变量 中 的 能 力 是 非常 强大 的 ， 它 使 得 在 脚本 程序 中 使 用 现 有 命令 并 捕 
获 其 输出 变 得 很 容易 。 如 果 需 要 把 一 条 命令 在 标准 输出 上 的 输出 转换 为 一 组 参数 ， 并 且 将 它们 用 做 为 
另 一 个 程序 的 参数 ， 你 会 发 现 命 令 xargs 可 以 帮 你 完成 这 一 工作 。 具 体 细节 请 参考 它 的 手册 页 。 

有 时 ， 当 你 打算 调用 的 命令 在 输出 你 想 要 的 内 容 之 前 先 输出 了 一 些 空白 字符 ， 或 者 它 输出 的 内 容 
比 你 想 要 的 要 多 的 时 候 也 会 出 现 问题 。 此 时 ， 你 可 以 用 前 面 介 绍 的 set 命 令 来 解决 。 
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1. 算术 扩展 

我 们 已 经 介绍 过 expr 命 令 ， 通 过 它 可 以 处 理 一 些 简单 的 算术 命令 ， 但 这 个 命令 执行 起 来 相当 慢 ， 
因为 它 需 要 调用 一 个 新 的 shell 来 处 理 expr 命 令 。 

一 种 更 新 更 好 的 办 法 是 使 用 3 ((...)) 扩 展 。 把 你 准备 求 值 的 表达 式 括 在 $( (.. .) ) 中 能 够 更 有 效 
地 完成 简单 的 算术 运算 。 如 下 所 示 : 

#!/bin/sh 

x=0 

while [ "$x" -ne 10 ]; do 

echo $x 


x=$( ($x+1)) 
done 


exit 0 





注意 ， 这 与 x=S$(.. .) 命 邻 不同 ， 两 对 国 括号 用 于 算术 替换 ， 而 我 们 之 前 见 到 的 一 对 贺 
括号 用 于 命令 的 执行 和 获取 给 出。 


2. 参数 扩展 
你 已 经 见 过 形式 最 简单 的 参数 赋值 和 扩展 了 ， 如 下 所 示 : 


foo=fred 
echo $foo 


但 当 你 想 在 变量 名 后 附加 额外 的 字符 时 就 会 遇 到 问题 。 假 设 你 想 编写 一 个 简短 的 脚本 程序 ， 来 处 
理 名 为 1_tmp 和 2_tmp 的 两 个 文件 。 你 可 能 会 这 样 写 : 
$1 /bin/sh 








fori in 1 2 
do 
my secret process $i tmp 

done 

但 是 在 每 次 循环 中 ， 你 都 会 看 到 如 下 所 示 的 出 错 信息 : 

my_secret_process: too few arguments 

哪里 出 错 了 呢 ? 

问题 在 于 shell 试 图 替换 变量 $i_tmp 的 值 ， 而 这 个 变量 其 实 并 不 存在 。shell 并 不 会 认为 这 是 一 个 错 
误 ， 仅 仅 会 将 它 替换 为 一 个 空 值 ， 因 此 根本 不 会 有 参数 被 传递 给 my_secret_process。 为 了 保护 变量 
名 中 类 似 于 $i 部 分 的 扩展 ， 你 需要 把 i 放 在 花 括号 中 ， 如 下 所 示 : 

1 /bin/sh 


fori in12 
do 

my secret process $(i) tmp 
done 


在 每 次 循环 中 , 变量 i 的 值 替 换 了 $ G), 从 而 给 出 正确 的 文件 名 。 也 就 是 说 ， 你 把 参数 的 值 替换 进 
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了 一 个 字符 串 。 
你 可 以 在 shell 中 采用 多 种 参数 替换 方法 。 对 于 多 参数 处 理 问题 来 说 ， 这 些 方法 通常 会 提供 一 种 精 
巧 的 解决 方案 。 表 2-20 列 出 了 一 些 常见 的 参数 扩展 方法 。 








表 220 
参数 扩展 说 有明 

$(param:-default) 如 果 param 为 空 ， 就 把 它 设置 为 default 的 值 

S${#param) 给 出 param 的 长 度 

S(paramsword) 从 param 的 尾部 开始 删除 与 word 匹 配 的 最 小 部 分 ， 然 后 返回 剩余 部 分 
${parambtword} MA parant ERF ER wora LERRA, FUGGRISHM A REA) 
$(paramiword) 从 param 的 头 部 开始 制 除 与 wora 匹 配 的 最 小 部 分 ， 然 后 返回 剩余 部 分 
$(param$$word) 从 param 的 头 部 开始 删除 与 word 匹 配 的 最 长 部 分 ， 然 后 返回 剩余 部 分 


当 处 理 字符 串 时 ， 这 些 普 换 通常 是 很 有 用 的 。 特 别 是 上 表 中 对 字符 申 进 行 部 分 删除 的 最 后 4 个 参 
数 扩展 方法 ， 在 处 理 文件 名 和 路 径 时 非常 有 用 ， 请 看 下 面 的 例子 。 


实验 参数 的 处 理 


下 面 脚本 程序 的 各 个 部 分 分 别 演示 了 各 种 参数 匹配 操作 符 的 用 法 : 
#!/bin/sh 


unset foo 
echo $(foo:-bar) 


foozfud 
echo $(foo:-bar) 


foos/usr/bin/X11/startx 
echo $(fook*/) 
echo ${foo##*/) 


barz/usr/local/etc/local/networks 
echo $(bar&local*) 
echo $(bar&$local*) 


exit 0 
它 的 输出 结果 如 下 : 


bar 
fud 
usr/bin/Xil/startx 
startx 
/usr/local/etc 
/usr 


第 一 条 语句 ${ foo: -bar) 给 出 的 值 是 par， 这 是 因为 在 这 条 语句 执行 时 foo 没 有 值 。 这 条 语句 执行 
后 ， 变 量 foo 未 发 生变 化 ， 它 还 停留 在 未 设置 状态 。 


2.6 shelléji&ik — 61 








如 果 这 条 语句 是 ${foo: =bar)， 那 么 变量 $foo 就 会 被 赋值 。 这 个 字符 囊 操作 符 的 作 
用 是 ， 检 查 变量 foo 是 否 存在 且 不 为 空 。 如 果 它 不 为 空 ， 就 返回 它 的 值 ， 否 则 就 把 变量 foo 
赋值 为 Dar 并 返回 这 个 值 . 

${foo: ?bar} 语 句 将 在 变量 foo 不 存在 或 它 设置 为 空 的 情况 下 ,输出 foo:bar 并 蜡 常 终 
止 脚本 程序 . 最后，${foo: +bar} 语 句 将 在 变量 foo 存 在 且 不 为 空 的 情况 下 返回 bar。 选择 
可 太 多 了 ! 


{foo#*/} 语 句 仅仅 匹配 并 删除 最 左边 的 /( 记 住 ，* 匹 配 零 个 或 多 个 字符 )。{ foo##*/} 语 句 匹 配 
并 删除 尽 可 能 多 的 字符 ， 所 以 它 删除 最 右边 的 /及 其 前 面 的 所 有 字符 。 

{bar%local*} 语 名 匹配 从 右边 起 直到 第 一 次 出 现 local (及 跟 在 它 后 面 的 所 有 字符 )， 而 
{bar%slocal*]} 语 句 则 从 右边 起 尽 可 能 多 地 匹配 字符 ， 直 到 遇 到 最 靠 左边 的 local。 

因为 UNIX 和 Linux 系 统 都 非常 依赖 过 滤器 的 思想 ， 所 以 一 个 操作 的 结果 常常 必须 手工 进行 重 定 
向 。 假 设 你 想 使 用 cjpeg 程 序 将 一 个 GIF 文件 转换 为 一 个 JPEG 文 件 : 

$ cjpeg image.gif > image.jpg 

但 有 时 ， 你 可 能 希望 对 大 量 文件 执行 这 类 操作 ， 那 么 如 何 实现 自动 重 定向 呢 ? 很 简单 ， 像 下 面 这 
样 做 即 可 : 











#!/bin/sh 
for image in *.gif 
do 
cjpeg $image > $(imagetigif)jpg 
done 


这 个 脚本 名 为 gifcojpeg， 它 为 当前 目录 中 的 每 个 GIF 文件 创建 一 个 对 应 的 JPEG 文 件 。 





2.6.7 here 文档 

在 shell 脚 本 程序 中 向 一 条 命令 传递 输入 的 一 种 特殊 方法 是 使 用 here 文 档 。 它 允许 一 条 命令 在 获得 
输入 数据 时 就 好 像 是 在 读 取 一 个 文件 或 键盘 一 样 ， 而 实际 上 是 从 脚本 程序 中 得 到 输入 数据 。 

here 文 档 以 两 个 连续 的 小 于 号 << 开 始 ， 紧 跟着 一 个 特殊 的 字符 序列 ， 该 序列 将 在 文档 的 结尾 处 再 
次 出 现 。<< 是 shell 的 标签 重 定向 符 ， 在 这 里 ， 它 强制 命令 的 输入 是 一 个 here 文 档 。 这 个 特殊 字符 序列 
的 作用 就 像 一 个 标记 ， 它 告诉 shell here 文 档 结束 的 位 置 。 因 为 这 个 标记 序列 不 能 出 现在 传递 给 命令 的 
文档 内 容 中 ， 所 以 应 该 尽量 使 它 既 容易 记忆 又 相当 不 寻常 。 


TUNE 使 用 here 文 档 


最 简单 的 例子 就 是 给 cat 命 令 提供 输入 数据 ， 如 下 所 示 : 
#!/bin/sh 





cat <<!FUNKY! 
hello 

this is a here 
document 
1FUNKY! 
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它 的 输出 如 下 所 示 : 
hello 

this is a here 
document 


here 文 档 功能 可 能 看 起 来 相当 奇怪 ， 但 其 实 它 的 作用 很 大 。 因 为 它 可 以 用 来 调用 交互 式 的 程序 ， 
比如 一 个 编辑 器 ， 并 向 它 提供 一 些 事先 定义 好 的 输入 。 但 它 更 常见 的 用 途 是 在 脚本 程序 中 输出 大 量 的 
文本 ， 就 像 你 在 刚才 的 示例 中 看 到 的 那样 ， 从 而 可 以 避免 用 echo 语 句 来 输出 每 一 行 。 你 可 以 在 标识 符 
两 端 都 使 用 感叹 号 〈!) 来 确保 不 会 引起 混淆 。 

如 果 想 按 预 定 的 方式 处 理 一 个 文件 中 的 几 行 ， 你 可 以 使 用 ea 行 编辑 器 ， 并 在 脚本 程序 中 通过 here 
文档 向 它 提供 命令 。 


E here 文 档 的 另 一 个 用 法 


(1) 我们 从 名 为 a_cext_file 的 文件 开始 ， 它 的 内 容 如 下 所 示 : 


That is line 1 
That is line 2 
That is line 3 
That is line 4 


(2) 你 可 以 通过 结合 使 用 here 文 档 和 ea 编辑 器 来 编辑 这 个 文件 : 
$1 /bin/sh 





ed a text file ««!FunkyStuff! 
3 
a 


"rr\$s/is/was/ 
w 


a 

!FunkyStuff! 

exit 0 

运行 这 个 脚本 程序 ， 现 在 这 个 文件 的 内 容 是 : 


That is line 1 
That is line 2 
That was line 4 


实验 解析 
这 个 脚本 程序 只 是 调用 ed 编辑 器 并 向 它 传递 命令 ， 先 让 它 移动 到 第 三 行 ， 然 后 删除 该 行 ， 再 把 当 
前 行 (因为 第 三 行 刚刚 被 删除 了 , 所 以 当前 行 现在 就 是 原来 的 最 后 一 行 , 即 第 四 行 ) 中 的 is 替换 为 was。 
完成 这 些 操作 的 ea 命令 来 自 脚 本 程序 中 的 here 文 档 一 一 在 标记 !Funkystuff! 之 间 的 那些 内 容 。 


注意 ， 我 们 在 here 文 档 中 用 \ 字 符 来 防止 $ 字 符 被 shell 扩 展 .\ 字 符 的 作用 是 对 $ 进 行 转 
义 ， 让 shell 知 道 不 要 尝试 把 Ss/is/was/ 扩 展 为 它 的 值 ， 而 它 也 确实 没有 值 ，shell 把 \$ 传 递 
为 $， 再 由 ed 编辑 器 对 它 进 行 解释 . 
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2.6.8 ”调试 脚本 程序 


脚本 程序 的 调试 通常 都 很 容易 ， 但 并 没有 特定 的 工具 帮助 我 们 进行 调试 。 在 本 节 中 ， 我 们 将 简单 
讲述 一 些 常 用 的 方法 。 

出 现 错误 时 ，shell 一 般 都 会 打印 出 包含 错误 的 行 的 行 号 。 如 果 这 个 错误 并 不 是 非常 明显 ， 你 可 以 
添加 一 些 额 外 的 echo 语 句 来 显示 变量 的 内 容 ， 也 可 以 通过 在 shell 中 交互 式 地 输入 代码 片段 来 对 它们 进 
行 测试 。 

因为 脚本 程序 是 解释 执行 的 ， 所 以 在 脚本 程序 的 修改 和 重 试 过 程 中 没有 编译 方面 的 额外 开支 。 跟 
踪 脚 本 程序 中 复杂 错误 的 主要 方法 是 设置 各 种 shell 选 项 。 为 此 , 你 可 以 在 调用 shell 时 加 上 命令 行 选项 ， 
或 是 使 用 set 命 令 。 表 2-21 列 出 了 各 种 选项 。 














表 2-21 
命令 行 选项 set 选 项 LE] 
sh -n «script» set -o noexec 只 检查 语法 错误 ， 不 执行 命令 
sh -v «script» et -o verbose 在 执行 命令 之 前 回 显 它们 
sh -x «script» -o xtrace 在 处 理 完 命令 之 后 回 显 它们 
set -x 
sh -u «script» set -o nounset 如 果 使 用 了 未 定义 的 变量 ， 就 给 出 出 错 消息 








你 可 以 用 -o 选 项 启用 set 命 令 的 选项 标志 , 用 +o 选 项 取消 设置 对 简写 版 本 也 是 一 样 的 处 理 方法 。 
你 可 以 通过 使 用 xtrace 选 项 来 得 到 一 份 简单 的 执行 跟踪 报告 。 在 调试 的 初始 阶段 ， 你 可 以 先 使 用 命令 
行 选项 的 方法 ,但 如 果 想 获得 更 好 的 调试 效果 ， 你 可 以 将 xtrace 标 志 ( 用 来 启用 或 关闭 执行 命令 的 跟 
BO 放 到 脚本 程序 中 问题 代码 的 前 后 。 执 行 跟踪 功能 让 shell 在 执行 每 行 语句 之 前 ， 先 输出 该 行 并 对 该 
行 中 变量 进行 扩展 。 

使 用 下 面 的 命令 来 启用 xtrace 选 项 ; 


set -o xtrace 


再 用 下 面 的 命令 来 关闭 xtrace 选 项 : 

set +o xtrace 

默认 情况 下 ,变量 扩展 的 层次 由 每 行 代码 前 的 * 号 个 数 指出 。 你 可 以 通过 对 shell 配 置 文件 中 的 shell 
变量 ps4 进 行 设置 ， 将 + 号 修改 为 更 有 意义 的 字符 。 

在 shell 中 ， 你 还 可 以 通过 捕获 ExTT 信 号 ， 从 而 在 脚本 程序 退出 时 查看 到 程序 的 状态 。 有 具体 做 法 是 
在 脚本 程序 的 开始 处 添加 类 似 下 面 这 样 的 一 条 语句 : 


trap 'echo Exiting: critical variable = $critical variable' EXIT 


2. BAAK: dialog IR 


在 结束 讨论 shell 脚 本 程序 之 前 ,我们 还 将 介绍 一 个 特性 。 尽 管 严格 来 说 ， 它 并 不 是 shell 的 一 部 分 ， 
但 是 在 通常 情况 下 ， 它 仅仅 在 shell 程 序 设 计 中 有 用 ， 所 以 我 们 将 在 这 里 讨论 它 。 

如 果 你 知道 你 的 脚本 程序 只 需要 运行 在 Linux 控 制 侣 上 ， 则 可 以 使 用 aialog 工 具 命令 ， 它 以 一 种 
非常 整洁 的 方式 润色 你 的 脚本 程序 。 这 个 命令 使 用 文本 模式 的 图 形 和 色彩 ,但 它 的 确 提供 了 友好 的 面 
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向 图 形 的 解决 方案 。 





一 些 Linux 发 行 版 默认 并 没有 安装 dialog 工 具 . 例如 ， 对 于 Ubuntu 来 说 ， 你 可 能 必须 
添加 公开 维护 的 套件 库 来 找到 一 个 现成 的 版 本 。 在 其 他 Linux 发 行 版 中 ， 你 可 能 会 找到 一 
个 已 安装 的 替代 工具 gdialog。 它 和 dialog 工 具 非常 相似 ， 但 它 依赖 GNOME 用 户 接口 来 
显示 其 对 话 框 。 然而， 你 得 到 的 回报 是 你 获得 了 一 个 真正 的 图 形 化 界面 。 一 般 来 说 ， 你 可 
以 将 任何 使 用 dialog 工 具 的 程序 中 对 dialog 工 具 的 调用 替换 为 对 gdialog 工 具 的 调用 , 从 
而 获得 程序 的 一 个 图 形 化 版 本 .我 们 将 在 本 节 最 后 提供 一 个 使 用 gdialog 的 程序 示例 。 


aialog 工 具 的 整体 思想 非常 简单 : 一 个 带 有 各 种 各 样 参 数 和 
选项 的 程序 ， 它 可 以 显示 各 种 类 型 的 图 形 框 ， 范 围 涵盖 从 最 简单 
的 Yes/No 框 到 输入 框 ， 甚 至 菜单 选项 。 这 个 工具 通常 在 用 户 执行 
某 种 类 型 的 输入 后 返回 洁 果 可 以 通过 退出 状态 获得 ， 或 在 
用 户 输入 文本 时 ， 通 过 标准 错误 流 来 获取 。 

在 详细 介绍 它 之 前 ， 我 们 先 来 看 一 个 非常 简单 的 使 用 aialog 
的 例子 。 你 可 以 在 命令 行 上 直接 使 用 aialog， 这 对 于 程序 的 原型 
设计 很 有 用 。 现 在 让 我 们 创建 一 个 简单 的 消息 框 ， 来 显示 传统 意 
义 上 的 第 一 个 程序 


dialog --msgbox "Hello Wo 
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L0 H4 GUAE, 你 可 以 通过 












执行 它 就 会 在 屏幕 上 显示 一 个 图 形 
OK 对 话 框 关闭 它 〈 见 图 2-3) 。 
现在 你 已 看 出 aialog 的 使 用 非常 容易 , 接 下 来 我 们 对 它 的 各 
种 可 能 性 进行 详细 地 介绍 。 表 2-22 列 出 了 你 可 以 创建 的 对 话 框 的 主要 类 型 。 
* 222 
类 型 用 于 创建 类 型 的 选项 含 x 
pE checklist 允许 用 户 显示 一 个 选项 列表 ， 每 个 选项 都 可 以 被 单独 选择 
信息 杠 在 显示 消息 后 ， 对 话 框 将 立刻 返回 ， 但 并 不 清除 屏幕 
LAN: 允许 用 户 输 入 文本 
菜单 杠 允许 用 户 选择 列表 中 的 一 项 





M eut msgbox 向 显示 一 条 消息 ， 同 时 显示 一 个 OK 按钮 ， 用 户 可 以 通过 选择 该 
按钮 继续 操作 


单 选 杠 : st 允许 用 户 选择 列表 中 的 一 个 选项 
文本 杠 xtbox 允许 用 户 在 带 有 滚动 条 的 文本 框 中 显示 一 个 文件 的 内 容 
Aust -yesno 允许 用 户 提问 ， 用 户 可 以 选择 yes 或 no 


还 有 一 些 其 他 的 对 话 框 类 型 〈 例 如， 进度 框 和 密码 框 ) 可用。 如果 你 想 了 解 更 多 不 常用 的 对 话 框 
类 型 ， 你 也 可 以 参考 在 线 手册 页 。 

如 果 想 获得 任何 类 型 的 允许 文本 输入 或 进行 选择 的 对 话 框 的 输出 ， 你 必须 捕获 标准 错误 流 ， 通 常 
是 把 它 指向 某 个 临时 文件 以 便 后 续 处 理 。 要 想 获 得 Yes/No 对 话 框 的 输出 结果 ， 只 需 查看 它 的 退出 码 ， 
与 所 有 设计 良好 的 程序 一 样 ， 返 回 0 表示 成 功 〔 例 如 ， 选 择 yes 选 项 )， 返 回 1 表示 失败 。 

所 有 的 对 话 框 类 型 都 有 各 种 各 样 的 用 于 控制 的 参数 ， 比 如 控制 显示 的 对 话 框 的 大 小 和 形状 。 我 们 
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其 中 一 部 分 参数 的 用 法 。 最 后 ， 你 将 





首先 列 出 每 种 类 型 需要 的 参数 ( 见 表 2-23)， 然 后 在 命令 行 上 
看 到 一 个 简单 的 将 几 种 对 话 框 结合 起 来 的 程序 
表 2-23 
对 话 框 类 型 参 。 数 

















列 出 ,5 
完整 的 选 


绍 两 个 选项 
F 


Y 


除 此 之 外 , 所 有 的 对 话 框 类 型 都 有 几 个 相同 名 
项 列表 请 查询 


title 和 -clear。 前 者 用 于 指定 对 话 框 的 标题 ， 
册页 。 











X 验 使 用 aialog 工 具 
让 我 们 直接 跳 到 一 个 很 复杂 的 例子 

这 个 例子 

高 15 字 






简单 了 ! 在 
L n 复 选 框 
并 设置 了 默认 的 开关 选择 











m 






在 本 例 中 ，--check 个 复 选 框 
title 选 项 将 标题 设置 为 ( 
ick Numbers 
屡 下 来 设置 对 话 框 的 大 小 
3 行 被 用 于 菜单 。 这 个 大 小 并 不 是 最 人 
从 中 看 到 内 容 的 排列 方式 。 
选项 的 设置 看 上 去 有 点 棘手 , 但 你 只 需要 记 住 每 个 菜 
单 选项 有 3 个 值 : 







参数 用 于 创建 








图 24 





第 一 个 菜单 项 的 的 文本 是 one， 状 态 设置 为 off。 第 二 个 菜单 项 的 值 分 别 是 2、two 
和 选中 。 依 次 继续 直到 菜单 项 设置 完毕 

是 不 是 和 ? 你 可 以 在 命令 行 上 尝试 一 下 , 看 的 使 用 有 多 么 简单 。 为 了 能 将 这 些 放 在 一 个 
昌 序 中 ， 你 需要 能 够 访问 用 户 输入 的 结果 。 这 一 点 很 容易 实现 ， 对 于 文本 输入 ， 你 只 需要 重 定向 标准 
错误 流 或 检查 环境 变量 s? 的 内 容 ，$? 的 值 实际 上 就 是 前 一 个 命令 的 退出 状态 。 
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[OE 一 个 更 复杂 的 使 用 aialog 工 具 的 程序 


我 们 来 看 一 个 名 为 questions 的 简单 程序 ， 它 关注 用 户 的 响应 : 

(1) 首先 ， 该 程序 通过 显示 一 个 简单 的 对 话 框 来 告诉 用 户 发 生 的 事情 。 你 不 需要 获得 返回 值 或 任 
何 用 户 的 输入 ， 所 以 这 看 起 来 非常 简单 和 友好 : 

#!/bin/sh 


# Ask some questions and collect the answer 


dialog --title "Questionnaire" --msgbox "Welcome to my simple survey" 9 18 


(2) 然后 用 一 个 简单 的 yes/no 对 话 框 来 询问 用 户 是 否 要 继续 操作 。 我 们 用 环境 变量 $? 来 检查 用 户 是 
否 选择 了 yes (返回 码 是 0)。 如 果 用 户 不 想 继续 操作 ， 就 使 用 一 个 简单 的 信息 框 显示 信息 ,信息 框 在 退 
出 之 前 不 需要 用 户 的 输入 。 

dialog --title "Confirm" --yesno *Are you willing to take part?" 9 18 


if [ $? != 0 ]; then 
dialog --infobox "Thank you anyway" 5 20 


sleep 2 
dialog --clear 
exit 0 
ti 
(3) 我 们 使 用 一 个 输入 框 来 询问 用 户 的 姓名 。 重 定向 标准 错误 流 2 到 临时 文件 _1.cxt， 然 后 再 将 它 
放 到 变量 Q_NAME 中 : 
dialog --title "Questionnaire" --inputbox "Please enter your name" 9 30 2>_1.txt 


Q.NAME-$(cat _1.txt) 

(4) 现在 显示 一 个 菜单 ， 它 有 4 个 不 同 的 选项 。 你 再 次 重 定向 标准 错误 流 并 且 把 它 装 载 到 一 个 变量 
"pu 

dialog --menu *$Q NAME, what music do you like best?" 15 30 4 1 "Classical" 2 

"Jazz" 3 "Country" 4 "Other" 2» 1.txt 

Q.MUSIC-$(cat .1.txt) 

(5) 用 户 选择 的 菜单 项 编号 将 被 保存 到 临时 文件 _1 .cxt 中 ， 同 时 这 个 结果 被 放 入 变量 Oo_MUsIc 中 ， 
以 便 你 对 结果 进行 测试 : 

if [ "$Q MUSIC" = *1" ]; then 

dialog --title "Likes Classical" --msgbox "Good choice!" 12 25 
else 


dialog --title "Doesn't like Classical" --msgbox "Shame" 12 25 
fi 


(6) 最 后 ， 清 除 对 话 框 并 退出 程序 : 
sleep 2 

dialog --clear 

exit 0 


图 2-5 显 示 了 屏幕 上 的 输出 信息 。 
本 例 通过 将 aialog 命 令 和 一 些 简单 的 shell 编 程 语句 相 结合 ， 讲 解 了 如 何 仅仅 使 用 shell 脚 本 来 构建 
简单 的 GUI 程序 。 程 序 从 一 个 简单 的 欢迎 页 面 开始 ， 然 后 使 用 一 个 简单 的 --yesno 对 话 框 询问 用 户 是 








保存 在 变量 5 
单项 编号 保存 












9 音乐 


出 适当 的 回应 





——ne(! 











如 果 你 运行 的 是 
ydialog 命 令 来 代替 
其 他 的 代码 完全 不 需 


会 出 结果 


FGNOME(l'JGUI, J 
个 命令 有 着 


共 的 终端 
需 将 调用 的 命令 从 改 为 
使 用 上 面 脚本 程序 的 


S$ 话 ， 你 就 可 以 使 
















a EHE YII 











这 是 从 一 个 脚本 程序 中 生成 可 用 
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28 综合 应 用 


至 此 ， 你 已 学 习 完 作为 程序 设计 语言 的 shell 的 主要 功能 。 是 时 候 运用 你 所 学 的 知识 来 编写 一 个 实 
际 的 示例 程序 了 。 

贯穿 全 书 , 你 将 编写 一 个 CD 数据 库 应 用 程序 , 从 而 更 好 地 掌握 所 学 的 知识 。 首先 从 shell 脚 本 开始 ， 
但 很 快 你 就 会 用 C 语 言 重 写 该 程序 ， 并 给 它 加 上 数据 库 等 新 功能 。 


2.8.1 需求 


假设 你 收集 了 大 量 的 CD 唱片 ， 现 在 为 了 方便 管理 ， 你 将 设计 和 实现 一 个 管理 CD 唱片 的 程序 。 在 
学 习 Linux 程 序 设计 的 过 程 中 ， 实 现 这 样 一 个 电子 CD 唱片 目录 看 起 来 是 一 个 比较 理想 的 项 目 。 

开始 阶段 ， 你 至 少 应 该 能 够 做 到 把 每 张 CD 唱片 的 基本 资料 保存 起 来 ， 如 唱片 的 名 称 、 音 乐 类 型 、 
艺术 家 或 作曲 家 的 名 字 等 。 你 可 能 还 想 再 保存 一 些 简单 的 曲目 信息 。 你 希望 能 够 以 每 张 CD 唱片 为 单 
位 进行 搜索 ， 而 不 是 以 曲目 资料 为 单位 。 为 了 让 这 个 小 小 的 应 用 程序 比较 完整 ， 你 还 希望 能 够 在 这 个 
应 用 程序 中 对 唱片 资料 进行 输入 、 更 新 和 删除 。 


2.8.2 设计 


3 项 需求 《对 数据 进行 更 新 、 检 索 和 显示 ) 应 该 采用 一 个 简单 的 菜单 就 足够 了 。 由 于 所 有 需要 存 
储 的 数据 全 部 都 是 文本 ， 而 且 假设 你 收集 的 CD 唱片 不 是 很 多 ， 因 此 你 就 没有 必要 使 用 一 个 复杂 的 数 
据 库 ， 使 用 一 些 简单 的 文本 文件 即 可 。 将 资料 保存 在 文本 文件 中 将 使 应 用 程序 比较 简单 ， 而 且 如 果 你 
变化 ， 操 纵 文本 文件 总 是 要 比 操纵 其 他 类 型 的 文件 更 加 容易 。 在 万 不 得 已 的 情况 下 ， 你 
使 用 一 个 编辑 器 来 手工 输入 和 删除 数据 ， 而 不 必 非 要 通过 编写 程序 

你 需要 为 数据 存储 作出 一 个 重要 的 设计 决策 ， 一 个 文件 够 用 吗 ? 如 果 够 用 ， 它 应 该 采用 什么 样 的 
格式 ? 除 曲 目 信息 以 外 ， 你 想 要 保存 的 大 部 分 资料 在 每 张 CD 唱片 上 只 出 现 一 次 〈 我 们 暂 不 考虑 某 些 
作曲 家 或 艺术 家 作品 的 情况 )， 而 且 几乎 所 有 CD 唱片 都 有 多 个 曲目 。 

你 需要 对 可 以 存储 在 CD 唱片 上 的 曲目 数量 加 一 个 限制 吗 ? 这 看 起 来 是 一 个 非常 随意 和 没有 必要 
的 限制 ， 所 以 还 是 立刻 放弃 这 个 想法 吧 ! 

如 果 对 曲目 数量 没有 限制 ， 你 就 有 以 下 3 种 选择 。 

O 只 使 用 一 个 文件 ， 用 一 行 来 保存 “标题 ”信息 ， 再 用 mn 行 保存 该 CD 唱片 上 的 曲目 信息 。 

O 将 每 张 CD 唱 片 的 所 有 信息 都 放置 在 一 行 上 ， 人 允许 该 行 一 直 延续 直到 没有 曲目 信息 需要 保存 为 

n 

O 把 标题 信息 和 曲目 信息 分 开 ， 用 不 同 的 文件 来 分 别 保存 它们 。 

只 有 第 三 种 做 法 能 够 让 你 灵活 地 修改 文件 的 格式 ， 如 果 今 后 你 想 把 数据 库 转换 为 关系 数据 库 格式 
的 话 〈 将 在 第 7 章 详 细 介 绍 )， 你 就 需要 修改 文件 格式 ， 因 此 我 们 选择 第 三 种 方法 。 

下 一 个 决策 是 要 在 文件 里 放 入 哪些 信息 。 

我 们 决定 对 每 张 CD 唱片 保存 以 下 信息 : 

口 CD 唱片 的 目录 编号 ; 

口 标题 ; 

O WHK GEM, ER HT REP): 

口 作曲 家 或 艺术 家 。 

对 曲目 ， 我 们 只 保存 两 条 信息 : 
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口 曲目 编号 ; 

口 曲名 。 

为 了 把 这 两 个 文件 结合 起 来 ， 你 必须 把 曲目 信息 和 CD 唱片 上 的 其 他 信息 关联 起 来 。 为 此 ， 你 需 
要 使 用 CD 唱片 的 目录 编号 。 因 为 它 对 每 张 CD 唱 片 都 是 唯一 的 ， 所 以 它 在 标题 文件 中 只 出 现 一 次 ， 在 
曲目 文件 中 对 每 首 曲目 也 只 出 现 一 次 。 

让 我 们 来 看 一 个 示例 标题 文件 ， 如 表 2-24 所 示 。 








表 2-24 
目录 编号 m 题 曲目 类 型 作 曲 家 
CD123 Cool sax [ES Bix 
CD234 Classic violin 古典 Bach 
CD345 Hits99 流行 Various 
它 所 对 应 的 曲目 文件 ， 如 表 2-25 所 示 。 
表 2-25 
目录 编号 曲目 编号 曲名 
CDI23 1 Some jazz 
CD123 2 More jazz 
CD234 1 Sonata in D minor 
CD345 1 Dizzy 


这 两 个 文件 通过 目录 编号 结合 在 一 起 。 请 记 住 ， 标 题 文件 中 的 一 个 数据 项 一 般 都 对 应 曲目 文件 中 
的 多 行 数据 。 

你 需要 决定 的 最 后 一 件 事情 是 如 何 分 隔 数据 项 。 在 关系 数据 库 里 , 长 度 固定 的 数据 字段 比较 常见 ， 
但 它 并 非 总 是 最 方便 的 。 另 一 种 常见 方法 是 使 用 逗号 ， 这 个 例子 就 选择 了 这 个 方法 〈 即 用 逗号 分 隔 变 
量 ， 或 CSV 文 件 )。 

在 接 下 来 的 “实验 ”部 分 ， 为 了 不 至 于 让 你 迷失 方向 ， 我 们 把 将 要 用 到 的 函数 列 在 下 面 : 

get return() 

get confirm() 

set. enu. choice() 

insert, title() 

insert track() 

add, record tracks() 

add records () 

find cd() 

update cd() 

count. cds () 

remove records() 

list. tracks() 
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(D 和 以 前 一 样 ， 这 个 示例 脚本 程序 的 第 一 行 用 于 确保 自己 可 以 作为 一 个 shell 脚 本 程序 来 执行 ， 接 
下 来 是 一 些 版 权 信息 : 
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*!/bin/bash 
* Very simple example shell script for managing a CD collection. 
# Copyright (C) 1996-2007 Wiley Publishing Inc. 


* This program is free software; you can redistribute it and/or modify it 
* under the terms of the GNU General Public License as published by the 
* Free Software Foundation; either version 2 of the License, or (at your 
* option) any later version. 


* This program is distributed in the hopes that it will be useful, but 

# WITHOUT ANY WARRANTY; without even the implied warranty of 

# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU General 
# Public License for more details. 


You should have received a copy of the GNU General Public License along 
with this program; if not, write to the Free Software Foundation, Inc. 
675 Mass Ave, Cambridge, MA 02139, USA. 


Q) 首先 要 做 的 事情 就 是 ， 确 保 设置 好 脚本 程序 将 要 用 到 的 一 些 全 局 变量 ， 包 括 标题 文件 、 曲 目 文 
件 和 一 个 临时 文件 。 我们 还 设置 CtrltC 组 合 键 的 中 断 处 理 , 以 确保 在 用 户 中 断 脚 本 程序 时 删除 临时 文件 : 


menu_choice="" 

current. cde** 

title files"title.cdb" 
tracks. file-'tracks.cdb* 
temp file-/tmp/cdb.$$ 

trap 'rm -f $temp file' EXIT 


(3) 现在 开始 定义 函数 。 因 为 脚本 程序 是 从 文件 的 第 一 行 开 始 执行 ， 所 以 这 样 做 可 以 确保 在 调用 
任何 一 个 函数 之 前 都 能 够 找到 它 的 定义 。 为 了 避免 在 几 个 地 方 反 复 编写 同样 的 代码 ， 最 开始 的 两 个 函 
数 是 简单 的 工具 型 函数 : 

get_return() { 

echo -e "Press return Vc" 
read x 


return 0 
) 


--— 








get confirm() ( 
echo -e "Are you sure? \c" 
while true 
do 
read x 
case "$x" in 
y | ves | Y | Yes | YES ) 


return 0;; 
nlno |N|No | No) 
echo 
echo "Cancelled" 
return 1;; 
*) echo "Please enter yes or no* ;; 
esac 


done 
H 
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(4) 接 下 来 是 主 菜单 函数 ser_menu_choice。 和 菜单 的 内 容 是 动态 变化 的 ， 当 用 户 选择 了 某 张 CD 唱 
片 后， 主 菜单 中 会 多 出 几 个 选项 。 


注意 ，echo-e 命 令 可 能 不 能 被 移植 到 某 些 shell 中 - 














set menu choice() ( 
clear 
echo "Options :-" 
echo 
echo " a) Add new CD* 
echo * f) Find CD* 
echo" c) Count the CDs and tracks in the catalog" 
if [ "$cdcatnum"* !- ** J; then 
echo * 1) List tracks on $cdtitle* 
echo” r) Remove $cdtitle* 
echo * u) Update track information for $cdtitle* 


echo * q) Quit" 
echo 
echo -e "Please enter choice then press return \c" 
read menu choice 
return 
) 


(5) 接 下 来 是 两 个 很 短小 的 函数 insert_title 和 insert_track, ENIA T Fe] i Meo f Hos nc 
据 。 虽 然 有 的 人 不 喜欢 这 种 长 度 只 有 一 行 的 函数 ， 但 它们 有 助 于 让 其 他 函数 的 含义 更 清晰 易 解 。 

紧 跟着 这 两 个 函数 的 是 一 个 比较 大 的 函数 ada_recora_cracks， 它 会 用 到 上 述 两 个 短小 的 函数 。 
这 个 函数 使 用 模式 匹配 来 确保 用 户 未 输入 逗号 (因为 我 们 把 逗号 用 做 数据 字段 之 间 的 分 隔 符 )， 使 用 
算术 操作 在 用 户 输入 曲目 时 递增 当前 曲目 的 编号 : 


insert title() ( 
echo $* >> $title file 
return 

) 


insert track() ( 
echo $* »» $tracks file 
return 


Y 


add record tracks() ( 
echo "Enter track information for this CD* 
echo "When no more tracks enter q" 
cdtrackzl 
cattitle="" 
while [ "$cdttitle* !- "q" ] 
do 
echo -e "Track $cdtrack, track title? Vc" 
read tmp 
cdttitle-$(tmpit,*) 
if [ "$tmp" !- "Scdttitle* ]; then 
echo "Sorry, no commas allowed" 
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continue 
fi 
if [ -n *$cdttitle* ] ; then 
if [ *$cdttitle* !- "q* ]; then 
insert track $cdcatnum, $cdtrack,$cdttitle 
fi 
else 
cdtracks$ ( (cdtrack-1)] 
i 


f 
cátrack-$ ( (cātrack+1) ) 
done 
) 


(6) add_records 函 数 用 于 和 输入 新 CD 唱片 的 标题 信息 : 


add records() ( 
* Prompt for the initial information 


echo -e "Enter catalog name \c" 
read tmp 
cdcatnum=$ (tmp&$, *) 


echo -e "Enter title |c* 
read tmp 
cdtitlesz$(tmp$$,*) 


echo -e "Enter type \c" 
read tmp 
cdtypes$(tmp$$,*) 


echo -e "Enter artist/composer Vc* 
read tmp 
cdac=$ (tmpt$, *) 


# Check that they want to enter the information 


echo About to add new entry 
echo "$cácatnum $cdtitle $cdtype $cdac* 


# If confirmed then append it to the titles file 


if get confirm ; then 
insert title $cácatnum, $cdtitle, $cdtype, $cdac 
add record tracks 

else 
remove records 

fi 


return 
) 
(7) fina_ca 函 数 的 作用 是 使 用 grep 命 令 在 CD 唱片 标题 文件 中 查找 CD 唱片 的 有 关 资 料 。 你 需要 知 
道 查询 字符 串 在 标题 文件 里 出 现 的 次 数 ， 但 grep 命 令 的 返回 值 只 能 告诉 你 该 字符 串 是 匹配 了 0 次 还 是 
多 次 。 为 了 解决 这 一 问题 ， 我 们 把 grep 命 令 的 输出 保存 到 一 个 临时 文件 中 ,文件 中 的 每 行 对 应 一 次 匹 





配 ， 然 后 再 统计 该 文件 的 行 数 。 
单词 统计 命令 wc 在 其 输出 中 使 用 空格 符 分 隔 被 统计 文件 中 的 行 数 、 单 词 数 和 字符 个 数 。 我 们 使 用 

s (we -1 stemp_file) 标 记 从 wc 命令 的 输出 结果 中 提取 出 第 一 个 参数 ， 并 赋值 给 变量 linesfound。 

如 果 要 用 到 wc 命令 输出 中 的 其 他 参数 ,你 可 以 利用 set 命 令 把 shell 参 数 变量 设置 为 wc 命令 的 输出 结果 。 
我 们 把 TPS 《内 部 数据 字段 分 隔 符 设置 为 一 个 记号， 这 样 你 就 可 以 读 取 以 过 号 分 陋 的 数据 字段 

了 。 另 一 个 可 选择 的 命令 是 cut。 国 


find cd() ( 

if [ "$1' = *n* ]; then 
asklisten 

else 
asklistey 

fi 

cdcatnum="" 

echo -e "Enter a string to search for in the CD titles \c" 

read searchstr 

if [ "$searchstr* = ** ]; then 
return 0 

fi 


grep "$searchstr* $title file > $temp file 


set $(wc -1 $temp file) 
linesfound-$1 


case "$linesfound* in 

0) echo "Sorry, nothing found" 
get return 
return 0 





1) 
2) echo "Sorry, not unique." 
echo "Found the following" 
cat $temp file 
get return 


return 0 

esac 

IFS-*," 

read cdcatnum cdtitle cdtype cdac < $temp file 
IFS=" " 

if [ -z '$cácatnum* ]; then 


echo "Sorry, could not extract catalog field from $temp file* 
get return 
return 0 

fi 


echo 

echo Catalog number: $cdcatnum 
echo Title: $cdtitle 

echo Type: $cdtype 
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echo Artist/Composer: $cdac 
echo 
get_return 


if [ "$asklist' = *y" ]; then 
echo -e "View tracks for this CD? Wc* 
read x 
if [ "$x' - "y* ]; then 
echo 
list tracks 
echo 


(8) update_cd 函 数 用 于 重新 输入 CD 唱片 的 资料 。 注 意 ， 你 想 要 搜索 (使 用 grep) 的 行 是 以 
$cdcatnum 开 头 (通过 标志 ^) 并 且 其 后 跟着 一 个 逗号 ， 因此 你 需要 把 $cacatnum 变 量 的 扩展 放 在 一 对 
花 括号 {} 里 ， 这 样 你 就 可 以 搜索 紧 跟 在 CD 目录 编号 之 后 的 逗号 了 。 这 个 函数 还 在 get_confirm 返 回 
true 的 情况 下 ， 用 花 括号 将 要 执行 的 多 个 语句 组 成 一 个 语句 块 。 


update cd() { 
if [ -z "$cdcatnum* ]; then 
echo "You must select a CD first" 
find cá n 
fi 
if [ -n "$cdcatnum* ]; then 
echo "Current tracks are :-" 
list. tracks 
echo 
echo "This will re-enter the tracks for $cdtitle" 
get confirm && ( 
grep -v '^$(cdcatnum)," $tracks file > Stemp file 
mv $temp file $tracks file 
echo 
add record tracks 


(9) count_cds 函 数 用 于 快速 统计 数据 库 中 CD 唱片 个 数 和 曲目 总 数 : 


count cds() ( 
set $(wc -1 $title file) 
num titles=$1 
set $(wc -1 $tracks file) 
num tracks-$l 
echo found $num titles CDs, with a total of $num tracks tracks 
get return 
return 


Y 
(10) remove_records 函 数 用 于 从 数据 库 文件 中 删除 数据 项 ， 它 通过 grep -v 命 令 删 除 所 有 匹配 





的 字符 串 。 注 意 ， 你 必须 使 用 一 个 临时 文件 来 完成 这 一 工作 。 
如 果 你 使 用 下 面 这 样 的 命令 : 


grep -v "^$cdcatnum* > $title file 


$title_file 文 件 就 会 在 grep 命 令 开始 执行 之 前 ， 被 > 输出 重 定向 操作 设置 为 空 文件 ， 结 果 导 致 grep 
命令 将 从 一 个 空 文件 里 读 取 数据 。 


remove records() ( 
if [ -z "$cdcatnum* ]; then 
echo You must select a CD first 
find cd n 
fi 
if [ -n "Scdcatnum* ]; then 
echo "You are about to delete $cdtitle* 
get confirm && ( 
grep -v "^$(cdcatnum),* $title file > $temp file 
mv $temp file $title file 
grep -v "^$(cdcatnum)," $tracks file > $temp file 
mv $temp file $tracks file 
cdcatnume"* 
echo Entry removed 
) 
get return 
fi 
return 


) 


(11) list_tracks 函 数 还 是 使 用 grep 命 令 来 找 出 你 想 要 的 行 ， 它 通过 cu 命令 来 访问 你 想 要 的 字 
段 ， 然 后 通过 more 命 令 提 供 按 页 输出 。 如 果 你 对 比 一 下 用 C 语 言 重新 实现 这 段 大 约 20 行 左右 的 代码 需 
要 多 少 条 语句 的 话 ， 你 就 不 得 不 佩服 shell 是 一 个 功能 多 么 强大 的 工具 了 。 

list_tracks() ( 

if [ '$cdcatnum* = ** ]; then 
echo no CD selected yet 
return 
else 
grep "^$(cdcatnum)," $tracks file > $temp file 
num trackss$(wc -1 $temp file) 
if [ "$num tracks* = "*0* ]; then 
echo no tracks found for $cdtitle 
else ( 
echo 
echo '$cátitle :-" 
echo 
cut -f 2- -d , $temp file 
echo 
) | $(PAGER:-more) 
fi 
fi 
get return 
return 


} 
(12) 现在 所 有 的 函数 都 已 定义 好 了 ， 你 可 以 进入 主 程序 部 分 了 。 开 头 的 几 行 先 确保 需要 的 文件 处 
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于 一 个 已 知 状态 ， 然 后 调用 主 菜单 函数 set_menu_choice， 再 根据 它 的 输出 进行 相应 的 操作 。 
如 果 用 户 选择 了 退出 ， 程 序 就 先 删除 临时 文件 ， 再 显示 结束 信息 ， 最 后 成 功 退 出 (退出 码 为 0): 


rm -f $temp file 


if [ ! -£ $title file ]; then 
touch $title file 

fi 

if [ ! -f $tracks file ]; then 
touch $tracks file 

fi 


# Now the application proper 


clear 
echo 

echo 

echo "Mini CD manager* 
sleep 1 


quitan 
while [ "$quit" != "y" ]; 
do 
set menu choice 
case "$menu choice* in 
a) add records;; 
r) remove records;; 
f) find cd y;; 
u) update. cd;; 
c) count cds;; 
1) list tracks;; 
b) 
echo 
more $title file 
echo 
get return;; 
qa | Q) quitzy;; 
*) echo "Sorry, choice not recognized';; 
esac 
done 


$Tidy up and leave 


rm -f $temp file 
echo "Finished" 
exit 0 


2.8.3 ”应 用 程序 的 说 明 
脚本 程序 开始 处 的 crap 命 令 用 于 设置 在 用 户 按 下 Ctrl+C 组 合 键 时 的 中 断 处 理 。 根 据 终端 设置 的 不 
同 ，CtrltC 组 合 键 可 能 引发 ExIT 或 INT 信 号 。 


实现 菜单 选择 还 有 其 他 的 办 法 ， 特 别 值得 一 提 的 是 bash 或 ksh 提 供 的 select 结 构 〈 但 它 未 被 列 在 
X/Open 规范 中 )。 它 是 一 个 专门 用 来 处 理 菜 单 选择 的 结构 。 如 果 你 并 不 介意 脚本 程序 移植 性 稍 差 的 话 ， 
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可 以 考虑 使 用 它 。 你 还 可 以 利用 here 文 档 来 实现 为 用 户 提供 多 行 信息 。 

你 可 能 已 注意 到 ， 当 添加 一 个 新 的 CD 唱片 记录 时 ， 程 序 并 没有 检查 其 主键 。 新 代码 只 是 忽略 使 
用 同样 主键 的 后 续 唱 片 标题 ， 但 把 它们 的 曲目 添加 到 第 一 个 使 用 该 主键 的 CD 唱片 的 曲目 清单 中 。 如 
下 所 示 : 

1 First CD Track 1 

2 First CD Track 2 

1 Another CD 

2 With the same CD key 


我 们 将 把 这 个 问题 及 其 他 改进 留 给 读者 ， 请 充分 发 挥 你 们 的 想象 力 和 创造 力 ， 因 为 你 可 以 在 GPL 
条 款 之 下 任意 修改 这 些 代码 。 


2.9 小 结 


在 本 章 中 ， 你 已 看 到 shell 本 身 就 是 一 种 功能 强大 的 程序 设计 语言 。 它 能 够 轻松 调用 其 他 程序 并 对 
它们 的 输出 进行 处 理 ， 这 种 能 力 使 得 shell 成 为 完成 文本 和 文件 处 理 任务 的 一 个 理想 工具 。 

当 你 下 一 次 需要 一 个 小 工具 程序 时 , 请 考虑 一 下 你 是 否 可 以 通过 将 一 些 Linux 命 令 组 合 进 一 个 shell 
脚本 程序 来 解决 自己 的 问题 。 你 会 惊讶 自己 竟然 在 不 使 用 编译 器 的 情况 下 ， 使 用 shell 就 可 以 编写 出 大 
量 的 工具 程序 。 





LER: 


文件 操作 
| 


本 章 中 ， 你 将 了 解 Linux 中 的 文件 、 目 录 以 及 相关 操作 。 你 将 学 习 如 何 创建 、 打 开 、 读 写 和 
关闭 文件 ， 还 将 学 习 程 序 是 如 何 处 理 目录 的 《例如 创建 、 扫 描 和 删除 目录 )。 在 上 一 章 我 们 

讨论 了 shell 之 后 ， 现 在 ， 你 将 开始 用 C 语 言 进行 编程 了 。 

在 开始 讨论 Linux 对 文件 WO 的 处 理 方法 之 前 ， 我 们 先 回顾 一 下 与 文件 、 目 录 和 设备 相关 的 概念 。 
为 了 对 文件 和 目录 进行 处 理 , 你 需要 用 到 系统 调用 (这 是 UNIX 和 Linux 中 与 Windows API 对 应 的 概念 )， 
但 系统 中 同时 还 存在 - 函数 一 一 标准 LO 库 (staio)， 可 以 更 有 效 地 进行 文件 处 理 。 

在 本 章 的 大 部 分 内 容 中 ， 我 们 将 详细 讨论 处 理 文件 和 目录 的 各 种 调用 。 因 此 ， 本 章 将 涵盖 如 下 各 
种 与 文件 相关 的 主题 : 

口 文 件 和 设备 

口 系统 调用 

口 库 函数 

口 底层 文件 访问 

口 管理 文件 

口 标准 1O 库 

O 格式 化 输入 和 输出 

O 文件 和 目录 的 维护 

口 扫描 目录 

O 错误 及 其 处 理 

口 /proc 文 件 系 统 

O 高 级 主题 : fcnc1 和 mmap 


3.1 Linux 文件 结构 


你 可 能 会 间 ;“ 为 什么 要 在 这 里 讨论 文件 结构 呢 ? 我 早 知 道 它 了 . ”这么 说 吧 , 与 UNIX 一 样 , Linux 
环境 中 的 文件 具有 特别 重要 的 意义 ， 因 为 它们 为 操作 系统 服务 和 设备 提供 了 一 个 简单 而 一 致 的 接口 。 
在 Linux 中 ， 一 切 (或 几乎 一 切 ) 都 是 文件 。 

这 就 意味 着 ,通常 程序 完全 可 以 像 使 用 文件 那样 使 用 磁盘 文件 、 串 行 口 、 打 印 机 和 其 他 设备 。 在 
本 书后 面 的 内 容 中 ， 我 们 将 介绍 一 些 例外 情况 ， 比 如 第 15 章 中 的 网 络 连接 。 但 大 多 数 情 况 下 ， 你 只 需 
要 使 用 5 个 基本 的 函数 一 open、close、read、write 和 ioct1。 

目录 也 是 文件 ， 但 它 是 一 种 特殊 类 型 的 文件 。 在 现代 的 UNIX (包括 Linux) 版 本 中 ， 即 使 是 超级 
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用 户 可 能 也 不 再 被 允许 直接 对 目录 进行 写 操作 了 。 所 有 用 户 通常 都 使 用 上 层 的 openair/readair 接 口 
来 读 取 目 录 , 而 无 需 了 解 特定 系统 中 目录 实现 的 具体 细节 。 我 们 将 在 本 章 的 后 面 介 绍 专门 的 目录 函数 。 

可 以 这 么 说 ，Linux 中 的 任何 事物 都 可 以 用 一 个 文件 来 表示 ， 或 者 通过 特殊 的 文件 提供 。 虽 然 它 
们 会 与 你 熟悉 的 传统 文件 有 一 些 细微 的 区 别 ， 但 两 者 的 基本 原理 是 一 致 的 。 下 面 就 让 我 们 来 看 看 到 目 
前 为 止 我 们 提 到 的 一 些 特殊 文件 。 
3.1.1 目录 

文件 ， 除 了 本 身 包含 的 内 容 以 外 ， 它 还 会 有 一 个 名 字 和 一 些 属性 ， 即 “管理 信息 ”包括 文件 的 
创建 / 修改 日 期 和 它 的 访问 权限 。 这 些 属性 被 保存 在 文件 的 inode (节点 ) 中 ， 它 是 文件 系统 中 的 一 个 
特殊 的 数据 块 , 它 同时 还 包含 文件 的 长 度 和 文件 在 磁盘 上 的 存放 位 置 系 统 使 用 的 是 文件 的 inode 编 号 ， 
目录 结构 为 文件 命名 仅仅 是 为 了 便于 人 们 使 用 。 

目录 是 用 于 保存 其 他 文件 的 节点 号 和 名 字 的 文件 。 目录 文 件 中 的 每 个 数据 项 都 是 指向 某 个 文件 节 
点 的 链接 ， 删 除 文件 名 就 等 于 删除 与 之 对 应 的 链接 文件 的 节点 号 可 以 通过 1n -i 命令 查看 )。 你 可 以 
通过 使 用 ln 命令 在 不 同 的 目录 中 创建 指向 同一 个 文件 的 链接 。 

删除 一 个 文件 时 ， 实 质 上 是 删除 了 该 文件 对 应 的 目录 项 ， 同 时 指向 该 文件 的 链接 数 减 1。 该 文件 
中 的 数据 可 能 仍然 能 够 通过 其 他 指向 同一 文件 的 链接 访问 到 。 如 果 指向 某 个 文件 的 链接 数 〈 即 1s -1 
命令 的 输出 中 跟 在 访问 权限 后 面 的 那个 数字 ) 变 为 零 ， 就 表示 该 节点 以 及 其 指向 的 数据 不 再 被 使 用 ， 
磁盘 上 的 相应 位 置 就 会 被 标记 为 可 用 空间 。 

文件 被 安排 在 目录 中 ， 目 录 中 可 能 还 包含 子 晶 录 。 这 些 构成 了 我 们 所 熟悉 的 文件 系统 层次 结构 。 
用 户 《〈 比 如 neil) 通常 会 将 自己 的 文件 保存 在 家 目录 中 ， 这 可 能 是 目录 / home/neil， 该 目录 还 将 包 
含 用 于 保存 电子 邮件 、 商 业 信函 、 工 具 程序 等 的 子 目 录 。 注 意 ， 许 多 UNIX 和 Linux 的 shell 都 允许 用 户 
通过 波浪 线 符号 C) 直接 进入 自己 的 家 目录 。 要 想 进入 他 人 的 家 目录 ， 就 键入 -user (MH) 
即 可 。 如 你 所 知 ， 每 个 用 户 的 家 目录 通常 是 一 个 上 层 目录 的 子 目录 ， 这 个 上 层 目 录 是 专 为 此 目的 而 创 
建 的 ， 在 本 例 中 ， 它 就 是 /home 目 录 。 

注意 ， 遭 粒 的 是 ， 标 准 库 函数 不 能 理解 文件 名 参数 中 的 shell 波 浪 线 速记 符号 ， 所 以 你 必 
须 始终 在 自己 的 程序 中 使 用 真实 的 文件 名 。 


/home 目 录 本 身 又 是 根 目录 /的 一 个 子 目 录 ， 根 目录 位 于 目录 
层次 的 最 顶端, 它 在 它 的 各 级 子 目 录 中 包含 着 系统 中 的 所 有 文件 。 
根 目录 中 通常 包含 用 于 存放 系统 程序 (二 进 制 可 执行 文件 ) 的 /bin 
子 目 录 、 用 于 存放 系统 配置 文件 的 /ecc 子 目录 和 用 于 存放 系统 函 | bin dev nome 
数 库 的 /1ib 子 目录 。 代 表 物 理 设备 并 为 这 些 设备 提供 接口 的 文件 























按照 惯例 会 被 放 在 /aev 子 目录 中 。 图 3-1 显 示 了 一 个 典型 的 Linux LACUNA 
目录 结构 的 一 部 分 。 KF Linux 文件 系统 布局 的 更 多 信息 请 见 第 18 

章 中 有 关 Linux 文 件 系统 标准 的 讨论 。 walt es MDanans 
3.1.2 文件 和 设备 图 3-1 


甚至 硬件 设备 在 Linux 中 通常 也 被 表示 映射 》 为 文件 。 例 如 ， 作 为 超级 用 户 ， 你 可 以 使 用 如 下 
命令 将 IDE CD-ROM 驱 动 器 挂 载 为 一 个 文件 : 


# mount -t iso9660 /dev/hdc /mnt/cdrom 
# cd /mnt/cárom 
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这 个 命令 将 CD-ROM 设 备 〈 在 本 例 中 ， 是 在 系统 启动 时 被 装载 为 /aevyhac 的 第 二 个 主 IDE 设 备 ， 其 他 
类 型 的 设备 对 应 不 同 的 /dev 条目) 中 的 当前 内 容 挂 载 为 /mnc/carom 目 录 下 的 文件 结构 。 然 后 ， 你 就 
可 以 像 往常 一 样 浏览 CD-ROM 的 目录 ， 只 不 过 该 目录 中 的 内 容 是 只 读 的 。 

UNIX 和 Linux 中 比较 重要 的 设备 文件 有 3 个 : /dev/console、/dev/tty 和 /dev/null。 

1. /dev/console 

这 个 设备 代表 的 是 系统 控制 台 。 错 误 信息 和 诊断 信息 通常 会 被 发 送 到 这 个 设备 。 每 个 UNIX 系 统 
都 会 有 一 个 指定 的 终端 或 显示 屏 用 来 接收 控制 台 消息 。 过 去 ， 它 可 能 是 一 台 专用 的 打印 终端 。 在 现代 
的 工作 站 和 Linux 上 ， 它 通常 是 “活跃 ”的 虚拟 控制 台 ， 而 在 X 视 窗 系统 中 ， 它 会 是 屏幕 上 一 个 特殊 的 
控制 台 窗口 。 

2. /dev/tty 

如 果 一 个 进程 有 控制 终端 的 话 ， 那 么 特殊 文件 /aev/tty 就 是 这 个 控制 终端 (键盘 和 显示 屏 ， 或 键 
盘 和 窗口 ) 的 别名 (逻辑 设备 )。 例 如 ， 由 系统 自动 运行 的 进程 和 脚本 就 没有 控制 终端 ， 所 以 它们 不 
能 打开 /Gev/tty。 

在 能 够 使 用 该 设备 文件 的 情况 下 ，/Gev/tty 允 许 程序 直接 向 用 户 输出 信息 ,而 不 管用 户 具体 使 用 
的 是 哪 种 类 型 的 伪 终 端 或 硬件 终端 。 在 标准 输出 被 重 定向 时 ， 这 一 功能 非常 有 用 。 使 用 命令 1s -R | 
more 显 示 一 个 长 目录 列表 就 是 一 个 这 样 的 例子 , more 程 序 需 要 提示 用 户 进行 键盘 操作 之 后 才能 显示 下 

-页 内 容 。 你 将 在 第 5 章 中 看 到 更 多 使 用 /dev/tty 的 例子 。 

注意 ， 虽 然 /aev/console 设 备 只 有 一 个 ， 但 通过 /aev/cty 却 能 够 访问 许多 不 同 的 物理 设备 。 

3. /dev/nu11 

/aevVnul1 文 件 是 空 null) 设备 。 所 有 写 向 这 个 设备 的 输出 都 将 被 丢弃 ， 而 读 这 个 设备 会 立刻 
返回 一 个 文件 尾 标志 ， 所 以 在 cp 命令 里 可 以 把 它 用 做 复制 空 文件 的 源 文件 ， 人 们 常 把 不 需要 的 输出 重 
定向 到 /dev/null。 

创建 空 文件 的 另 一 个 方法 是 使 用 touch <filename> 命 令 ， 该 命令 的 作用 是 改变 文件 的 

修改 时 间 。 如 果 指定 的 文件 不 存在 , 就 创建 它 ,但 该 命令 并 不 会 把 有 内 容 的 文件 变 成 空 文件 。 

$ echo do not want to see this »/dev/null 

$ cp /dev/null empty file 

/dev 目 录 中 的 其 他 设备 包括 : 硬盘 和 软盘 、 通 信 端 口 、 磁 带 驱动 器 、CD-ROM、 声 卡 以 及 一 些 代 
表 系 统 内 部 工作 状态 的 设备 。 该 目录 中 甚至 还 有 /Gev/zero 设 备 ， 它 可 以 作为 创建 空 文件 的 null 字 节 
源 。 访 问 该 目录 中 的 某 些 设备 需要 具有 超级 用 户 权 限 ， 普 通用 户 不 能 通过 编写 程序 来 直接 访问 如 硬盘 
这 样 的 底层 设备 。 设 备 文件 的 名 字 会 随 系统 的 不 同 而 不 同 。Linux 发 行 版 通常 都 提供 了 以 超级 用 户 身 
份 运行 的 应 用 程序 , 用 来 管理 那些 以 其 他 用 户 身份 无 法 访问 的 设备 , 例如 , 用 于 挂 载 文件 系统 的 mount 
命令 。 

设备 被 分 为 字符 设备 和 块 设备 。 两 者 区 别 在 于 访问 设备 时 是 否 需要 一 次 读 写 一 整 块 。 一 般 情况 下 ， 
块 设备 是 那些 支持 某 些 类 型 文件 系统 的 设备 ， 例 如 硬盘 。 

在 本 章 中 ， 我 们 将 集中 讨论 磁盘 文件 和 目录 。 我 们 将 在 第 5 章 中 讨论 另 一 种 设备 一 一 用 户 终端 。 


3.2 系统 调用 和 设备 驱动 程序 


你 只 需 用 很 少量 的 函数 就 可 以 对 文件 和 设备 进行 访问 和 控制 . 这 些 函数 被 称 为 系统 调用 , 由 UNIX 
(和 Linux) 直接 提供 ， 它 们 也 是 通 向 操作 系统 本 身 的 接口 。 
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操作 系统 的 核心 部 分 ， 即 内 核 ， 是 一 组 设备 驱动 程序 。 它 们 是 一 组 对 系统 硬件 进行 控制 的 底层 
接口 。 例 如 ， 磁 带 机 就 有 一 个 与 之 对 应 的 设备 驱动 程序 ， 它 知道 如 何 启动 磁带 、 如 何 对 它 前 后 回 绕 、 
如 何 对 它 进行 读 写 等 。 它 还 知道 磁带 必须 以 固定 长 度 的 数据 块 为 单位 进行 读 写 。 因 为 磁带 在 实质 上 
是 一 个 顺序 存 取 设 备 ， 所 以 驱动 程序 并 不 能 直接 访问 磁带 上 的 数据 块 . 而 是 必须 先 把 它 回 绕 到 正确 
的 位 置 。 

为 了 向 用 户 提供 一 个 一 致 的 接口 ， 设 备 驱动 程序 封装 了 所 有 与 硬件 相关 的 特性 。 硬 件 的 特有 功能 
通常 可 通过 ioct1〈 用 于 I/o 控 制 ) 系统 调用 来 提供 。 

/dev 目 录 中 的 设备 文件 的 用 法 都 是 相同 的 ， 它 们 都 可 以 被 打开 、 读 、 写 和 关闭 。 例如， 用 来 访问 
普通 文件 的 open 调 用 同样 可 以 用 来 访问 用 户 终端 、 打 印 机 或 磁带 机 。 

下 面 是 用 于 访问 设备 驱动 程序 的 底层 函数 系统 调用 )。 

口 open: 打开 文件 或 设备 。 

口 read: 从 打开 的 文件 或 设备 里 读数 据 。 

口 write: 向 文件 或 设备 写 数据 。 

口 close: 关闭 文件 或 设备 。 

U ioctl: 把 控制 信息 传递 给 设备 驱动 程序 。 

系统 调用 ioct1 用 于 提供 一 些 与 特定 硬件 设备 有 关 的 必要 控制 (与 正常 的 输入 输出 相反 )， 所 以 它 
的 用 法 随 设备 的 不 同 而 不 同 。 例 如 ，ioct1 调 用 可 以 用 于 回 绕 磁带 机 或 设置 串 行 口 的 流 控 特性 。 因 此 ， 
ioct1 并 不 需要 具备 可 移植 性 。 此 外 ， 每 个 驱动 程序 都 定义 了 它 自己 的 一 组 ioct1 命 令 。 

这 些 系 统 调用 和 其 他 系统 调用 的 文档 一 般 放 在 手册 页 的 第 二 节 。 提 供 系 统 调用 参数 列表 和 返回 类 
型 的 函数 原型 及 相关 的 #define 常 量 都 由 include 文 件 提供 。 每 个 系统 调用 独 有 的 要 求 可 参见 各 个 系统 
调用 的 说 明 。 


3.3 HEURE 


针对 输入 输出 操作 直接 使 用 底层 系统 调用 的 一 个 问题 是 它们 的 效率 非常 低 。 为 什么 呢 ? 

O 使 用 系统 调用 会 影响 系统 的 性 能 。 与 函数 调用 相 比 ， 系 统 调用 的 开销 要 大 些 ， 因 为 在 执行 系统 
调用 时 ，Linux 必 须 从 运行 用 户 代码 切换 到 执行 内 核 代 码 ， 然 后 再 返回 用 户 代 码 。 减 少 这 种 开 
销 的 一 个 好 方法 是 ， 在 程序 中 尽量 减少 系统 调用 的 次 数 ， 并 且 让 每 次 系统 调用 完成 尽 可 能 多 的 
工作 。 例 如 ， 每 次 读 写 大 量 的 数据 而 不 是 每 次 仅 读 写 一 个 字符 。 

口 硬件 会 限制 对 底层 系统 调用 一 次 所 能 读 写 的 数据 块 大 小 。 例 如 ， 磁 带 机 通常 一 次 能 写 的 数据 块 
长 度 是 10k。 所 以 ， 如 果 你 试图 写 的 数据 量 不 是 10k 的 整数 倍 ， 磁 带 机 还 是 会 以 10k 为 单位 卷 绕 
磁带 ， 从 而 在 磁带 上 留 下 了 空隙 。 

为 了 给 设备 和 磁盘 文件 提供 更 高 层 的 接口 ，Linux 发 行 版 (和 UNIX) 提供 了 一 系列 的 标准 函数 库 。 
它们 是 一 些 由 函数 构成 的 集合 , 你 可 以 把 它们 应 用 到 自己 的 程序 中 ,比如 提供 输出 缓冲 功能 的 标准 1O 
库 。 你 可 以 高 效 地 写 任意 长 度 的 数据 块 ， 库 函数 则 在 数据 满足 数据 块 长 度 要 求 时 安排 执行 底层 系统 调 
用 。 这 就 极 大 降低 了 系统 调用 的 开销 。 

库 函数 的 文档 一 般 被 放 在 手册 页 的 第 三 节 ， 并 且 库 函数 往往 会 有 一 个 与 之 对 应 的 标准 头 文件 ， 例 
如 与 标准 1/O 库 对 应 的 头 文件 是 stGio.h。 

图 3-2 是 对 前 面 几 小 节 讨 论 的 总 结 ， 它 显示 了 Linux 系 统 中 各 种 文件 函数 与 用 户 、 设 备 驱动 程序 、 
内 核 和 硬件 之 间 的 关系 。 








用 户 空间 


























3.4 ”底层 文件 访问 

每 个 运行 中 的 程序 被 称 为 进程 (process)， 它 有 一 些 与 之 关联 的 文件 描述 符 。 这 是 一 些小 值 整数 ， 
你 可 以 通过 它们 访问 打开 的 文件 或 设备 。 有 多 少 文件 描述 符 可 用 取决 于 系统 的 配置 情况 。 当 一 个 程序 
开始 运行 时 ， 它 一 般 会 有 3 个 已 经 打开 的 文件 描述 符 : 
标准 输入 






O2: 标准 错误 
你 可 以 通过 系统 调用 open 把 其 他 文件 描述 符 与 文件 和 设备 相关 联 ， 稍 后 讲解 。 其 实 使 用 自动 打开 
的 文件 描述 符 就 已 经 可 以 通过 write 系 统 调用 来 创建 一 些 简单 的 程序 了 。 


3.4.1 write 系统 调用 

系统 调用 write 的 作用 是 把 缓冲 区 buf 的 前 nbyres 个 字 节 写 入 与 文件 描述 符 fildes 关 联 的 文件 
中 , 它 返 回 实际 写 入 的 字 节 数 。 如 果 文件 描述 符 有 错 或 者 设备 驱动 程序 对 数据 块 长 度 比较 敏感 ， 
该 返回 值 可 能 会 小 于 nibytes。 如 果 这 个 函数 返回 9 ， 就 表示 未 写 入 任何 数据 ;如 果 它 返回 的 是 -1， 就 
dy ite 调 用 中 出 现 了 错误 ， 错 误 代码 保存 在 全 局 变量 errno 里 。 

下 面 是 write 系 统 调用 的 原型 : 

#include <unistd.h> 








size_t write(int fildes, const void *buf, size t nbytes); 
有 了 这 些 知识 ， 你 就 可 以 编写 第 一 个 程序 simple_write.c 了 : 
#include <unistd.h> 

#include <stdlib.h> 


int main() 
t 
if ((write(l, "Here is some dataWn*, 18)) !- 18) 
write(2, "A write error has occurred on file descriptor 1\n", 46); 


exit(0); 
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这 个 程序 只 是 在 标准 输出 上 显示 一 条 消息 。 当 程序 退出 运行 时 ， 所 有 已 经 打开 的 文件 描述 符 都 会 
自动 关闭 ， 所 以 你 不 需要 明确 地 关闭 它们 。 但 处 理 被 缓冲 的 输出 时 ， 情 况 就 不 一 样 了 。 


$ ./simple write 
Here is some data 


E 
需要 再 次 提醒 的 是 ，write 可 能 会 报告 写 入 的 字 节 比 你 要 求 的 少 。 这 并 不 一 定 是 个 错误 。 在 程序 
中 ， 你 需要 检查 errno 以 发 现 错误 ， 然 后 再 次 调用 write 写 入 剩余 的 数据 。 


3.4.2 read 系统 调用 


系统 调用 read 的 作用 是 : 从 与 文件 描述 符 fildes 相 关联 的 文件 里 读 入 nbytes 个 字 节 的 数据 ， 并 
把 它们 放 到 数据 区 buf 中 。 它 返回 实际 读 入 的 字 节 数 ， 这 可 能 会 小 于 请 求 的 字 节 数 。 如 果 read 调 用 返 
回 0， 就 表示 未 读 入 任何 数据 ， 已 到 达 了 文件 尾 。 同 样 ， 如 果 返 回 的 是 -1， 就 表示 reaa 调 用 出 现 了 错误 。 
#include <unistd.h> 


size_t read(int fildes, void *buf, size t nbytes); 

下 面 这 个 程序 simple_read.c 把 标准 输入 的 前 128 个 字 节 复制 到 标准 输出 。 如 果 输入 少 于 128 个 字 
节 ， 就 把 它们 全 体 复 制 过 去 。 

#include «unistd.h» 

#include <stdlib.h> 


int main() 


char buffer[128]; 
int nread; 


nread - read(0, buffer, 128); 
if (nread == -1) 
write(2, "A read error has occurredWn', 26); 


if ((write(l,buffer,nread)) != nread) 
write(2, "A write error has occurred n"*,27); 


exit(0); 

) 

运行 这 个 程序 ， 你 会 看 到 : 

$ echo hello there | ./simple read 

hello there 

$ ./simple read < drafti.txt 

Files 

In this chapter we will be looking at files and directories and how to manipulate 
them. We will learn how to create files,$ 


第 一 次 运行 程序 时 ， 你 使 用 echo 通 过 管道 为 程序 提供 输入 。 在 第 二 次 运行 时 ， 你 通过 文件 重 定向 
输入 。 此 时 ， 你 可 以 看 到 文件 Graft1.txt 的 第 一 部 分 出 现在 了 标准 输出 上 。 
请 注意 ， 下 一 个 shell 提 示 符 出 现在 输出 数据 最 后 一 行 的 尾部 ， 因 为 在 这 个 例子 中 ，128 
个 字 节 的 数据 并 没有 构成 一 个 完整 的 行 - 
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3.4.3 open 系统 调用 
为 了 创建 一 个 新 的 文件 描述 符 ， 你 需要 使 用 系统 调用 open。 


#include «fcntl.h» 
#include «sys/types.h» 
#include <sys/stat.h> 


int open(const char *path, int oflags); 
int open(const char *path, int oflags, mode t mode); 
PORA, GE USPOSIX 规范 的 系统 上 ， 使 用 open 系 统 调用 并 不 需要 包括 头 文件 

sys/types.h 和 sys/stat .h， 但 在 某 些 UNIX 系 统 上 ， 它 们 可 能 是 必 不 可 少 的 。 

简单 地 说 , open 建立 了 一 条 到 文件 或 设备 的 访问 路 径 。 如 果 调用 成 功 , 它 将 返回 一 个 可 以 被 read、 
write 和 其 他 系统 调用 使 用 的 文件 描述 符 。 这 个 文件 描述 符 是 唯一 的 ， 它 不 会 与 任何 其 他 运行 中 的 进 
程 共享 。 如 果 两 个 程序 同时 打开 同一 个 文件 ， 它 们 会 分 别 得 到 两 个 不 同 的 文件 描述 符 。 如 果 它 们 都 对 
文件 进行 写 操作 ， 那 么 它们 会 各 写 各 的 ， 它 们 分 别 接着 上 次 离开 的 位 置 继续 往 下 写 。 它 们 的 数据 不 会 
交织 在 一 起 ， 而 是 彼此 互相 覆盖 。 两 个 程序 对 文件 的 读 写 位 置 〈 偏 移 值 ) 不 同 。 你 可 以 通过 使 用 文件 
锁 功能 来 防止 出 现 冲 突 ， 我 们 将 在 第 7 章 里 介绍 该 功能 。 

准备 打开 的 文件 或 设备 的 名 字 作为 参数 path 传 递 给 函数 ，of1ags 参 数 用 于 指定 打开 文件 所 采取 
的 动作 。 

of lags 参 数 是 通过 必需 文件 访问 模式 与 其 他 可 选 模式 相 结 合 的 方式 来 指定 的 。open 调 用 必须 指 
定 表 3-1 中 所 示 的 文件 访问 模式 之 一 。 








表 3-1 
a" x 说 m 
O. RDONLY 以 只 读 方式 打开 
QEMBONDY- 以 只 写 方式 打开 
OR 以 读 写 方式 打开 


open 调 用 还 可 以 在 oflags 参 数 中 包括 下 列 可 选 模式 的 组 合用 “ 按 位 或 ”操作 )。 
O o APPEND: 把 写 入 数据 追加 在 文件 的 末尾 。 
口 0_TRUNC: 把 文件 长 度 设 置 为 零 ， 丢 弃 已 有 的 内 容 。 
口 o_cREAT: 如 果 需 要 ， 就 按 参数 mode 中 给 出 的 访问 模式 创建 文件 。 
口 0_ExcL: 与 0_CREAT 一 起 使 用 , 确保 调用 者 创建 出 文件 .open 调用 是 一 个 原子 操作 ,也 就 是 说 ， 
它 只 执行 一 个 函数 调用 。 使 用 这 个 可 选 模式 可 以 防止 两 个 程序 同时 创建 同一 个 文件 。 如果 文件 
已 经 存在 ，open 调 用 将 失败 。 
其 他 可 以 使 用 的 of1ag 值 请 参考 open 调 用 的 手册 页 ， 它 们 出 现在 该 手册 页 的 第 二 节 (使 用 man 2 
open 命 令 查看 )。 
open 调 用 在 成 功 时 返回 一 个 新 的 文件 描述 符 〔 它 总 是 一 个 非 负 整数 )， 在 失败 时 返回 -1 并 设置 全 
局 变量 errno 来 指明 失败 的 原因 。 我 们 将 在 本 章 后 面 对 errno 做 进一步 讨论 。 新 文件 描述 符 总 是 使 用 
未 用 描述 符 的 最 小 值 ， 这 个 特征 在 某 些 情况 下 非常 有 用 。 例 如 ， 如 果 一 个 程序 关闭 了 它 的 标准 输出 ， 
然后 再 次 调用 open， 文 件 描述 符 ! 就 会 被 重新 使 用 ， 并 且 标 准 输出 将 被 有 效 地 重 定向 到 另 一 个 文件 或 
设备 。 
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POSIX 规 范 还 标准 化 了 一 个 creat 调 用 ， 但 它 并 不 常用 。 这 个 调用 不 仅 会 像 我 们 预期 的 那样 创建 
文件 ， 还 会 打开 文件 。 它 的 作用 相当 于 以 of1ags 标 志 o0_CREAT10_WRONLY10_TRUNC 来 调用 open。 

任何 一 个 运行 中 的 程序 能 够 同时 打开 的 文件 数 是 有 限制 的 .这 个 限制 通常 是 由 1imits.h 头 文件 中 
的 常量 oPEN_MAx 定 义 的 ， 它 的 值 随 系统 的 不 同 而 不 同 ， 但 POSIX 要 求 它 至 少 为 16。 这 个 限制 本 身 还 受 
到 本 地 系统 全 局 性 限制 的 影响 ， 所 以 一 个 程序 未 必 总 是 能 够 打开 这 么 多 文件 。 在 Linux 系 统 中 ， 这 个 
限制 可 以 在 系统 运行 时 调整 ， 所 以 oPEN_MAx 并 不 是 一 个 常量 。 它 通常 一 开始 被 设置 为 256。 


3.44 ”访问 权限 的 初始 值 


当 你 使 用 带 有 o_cCREAT 标 志 的 open 调 用 来 创建 文件 时 ， 你 必须 使 用 有 3 个 参数 格式 的 open 调 用 。 
第 三 个 参数 mode 是 几 个 标志 按 位 或 后 得 到 的 ， 这 些 标志 在 头 文件 sys/stat .h. 中 定义 ， 如 下 所 示 。 

口 s_IRUSR: 读 权限 ， 文 件 属 主 。 

口 s_IwUsR: 写 权限 ， 文 件 属 主 。 

üsixusm 执行 权限 ， 文 件 属 主 。 

口 s_IRGRP: 读 权 限 ， 文 件 所 属 组 。 

口 s_IwGRP: 写 权限 ， 文 件 所 属 组 。 

O S_IXGRP: 执行 权限 ， 文 件 所 属 组 。 

O S_IROTH: 读 权限 ， 其 他 用 户 。 

口 s_lwoTH: 写 权 限 ， 其 他 用 户 。 

口 s_IxoTH: 执行 权限 ， 其 他 用 户 。 

请 看 下 面 的 例子 : 

open ("myfile", O_CREAT, S IRUSR|S IXOTH); 


它 的 作用 是 创建 一 个 名 为 myfile 的 文件 ， 文 件 属 主 拥有 读 权限 ， 其 他 用 户 拥 有 执行 权限 , 且 只 设置 了 
这 些 权限 。 


$ 1s -ls myfile 
0 -r-------x 1 neil software 0 Sep 22 08:11 myfile* 


有 几 个 因素 会 对 文件 的 访问 权限 产生 影响 。 首 先 ， 指 定 的 访问 权限 只 有 在 创建 文件 时 才 会 使 用 。 
其 次 , 用 户 掩 码 (由 shell 的 umask 命 令 设 定 ) 会 影响 到 被 创建 文件 的 访问 权限 。open 调 用 里 给 出 的 mode 
值 将 与 当时 的 用 户 掩 码 的 反 值 做 AND 操 作 。 举 例 来 说 ， 如 果 用 户 掩 码 被 设置 为 001， 并 且 指定 了 
S_IXOTH 模 式 标志 ， 那 么 其 他 用 户 对 创建 的 文件 不 会 拥有 执行 权限 ， 因 为 用 户 掩 码 中 指定 了 不 允许 向 
其 他 用 户 提供 执行 权限 。 因 此 ，open 和 creat 调 用 中 的 标志 实际 上 是 发 出 设置 文件 访问 权限 的 请 求 ， 
所 请 求 的 权限 是 否 会 被 设置 取决 于 当时 umasx 的 值 。 

1. umask 

umask 是 一 个 系统 变量 ， 它 的 作用 是 ， 当 文件 被 创建 时 ， 为 文件 的 访问 权限 设 定 一 个 掩 码 。 执 行 
umask 命 令 可 以 修改 这 个 变量 的 值 , 它 是 一 个 由 3 个 八进制 数字 组 成 的 值 . 每 个 数字 都 是 八进制 值 1、2、 
4 的 OR 操作 结果 。 它 们 的 具体 含义 见 表 3-2， 这 3 个 数字 分 别 对 应 着 用 户 (user)、 组 (group〉 和 其 他 用 
户 Cother) 的 访问 权限 。 








k t 取 ü *& x 
1 0 允许 属 主任 何 权限 











GE) 





& T 取 a E x 
4 禁止 属 主 的 读 权限 

2 禁止 属 主 的 写 权限 

1 禁止 属 主 的 执行 权限 
0 允许 组 任何 权限 

4 禁止 组 的 读 权 限 

2 禁止 组 的 写 权限 
1 
0 
4 
2: 
1 





禁止 组 的 执行 权限 

允许 其 他 用 户 任何 权限 
禁止 其 他 用 户 的 读 权限 
禁止 其 他 用 户 的 写 权限 


禁止 其 他 用 户 的 执行 权限 
一 一 一 LL 


例如 ， 如 果 要 禁止 组 的 写 和 执行 权限 ， 同 时 禁止 其 他 用 户 的 写 权限 ， 那 么 umask 值 应 该 如 表 3-3 所 


R 3-3 











-no 





每 个 数字 的 取 值 OR 在 一 起 ， 因 此 第 2 个 数字 的 值 是 2 | 1， 结 果 为 3。 最 终 的 umasx 值 为 032。 

当 你 通过 open 或 creat 调 用 创建 文件 时 ，mode 参 数 将 与 当前 的 umask 值 进行 比较 。 在 mode 参 数 中 
被 设置 的 位 如 果 在 umask 值 中 也 被 设置 了 ， 那 么 它 就 会 从 文件 的 访问 权限 中 删除 。 因 此 ， 用 户 完全 可 
以 设置 自己 的 环境 ， 比 如 “不 准 创建 允许 其 他 用 户 有 写 权限 的 文件 ， 即 使 创建 该 文件 的 程序 要 求 该 权 
限 也 不 行 。” 这样 做 虽然 并 不 能 阻止 程序 或 用 户 在 随后 使 用 chmod 命 令 或 者 在 程序 中 使 用 chmoa 系 统 
调用 ) 来 添加 其 他 用 户 的 写 权限 ， 但 它 确实 能 够 帮助 用 户 ， 使 他 们 不 必 对 每 个 新 文件 都 去 检查 和 设置 
其 访问 权限 。 

2. close 系 统 调用 

你 可 以 使 用 close 调 用 终止 文件 描述 符 filaes 与 其 对 应 文件 之 间 的 关联 。 文 件 描述 符 被 释放 并 能 
够 重新 使 用 。close 调 用 成 功 时 返回 0， 出 错时 返回 -1。 


#include <unistd.h> 
int close(int fildes); 


注意 ， 检 查 close 调 用 的 返回 结果 非常 重要 。 有 的 文件 系统 ， 特 别 是 网 络 文件 系统 ， 可 
能 不 会 在 关闭 文件 之 前 报告 文件 写 操作 中 出 现 的 错误 ， 这 是 因为 在 执行 写 操作 时 ， 数 据 可 能 
未 被 确认 写 入 。 
3. ioct1 系 统 调用 
ioct1 调 用 有 点 像 是 个 大 杂烩 。 它 提供 了 一 个 用 于 控制 设备 及 其 描述 符 行为 和 配置 底层 服务 的 接 
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口 。 终 端 、 文件 描述 符 、 套 接 字 甚至 磁带 机 都 可 以 有 为 它们 定义 的 ioctl1， 具 体 细节 可 以 参考 特定 设 
备 的 手册 页 。 POSIX 规 范 只 为 流 (stream) 定 义 了 ioct1 调 用 , 但 它 超出 了 本 书 讨论 的 范围 。 下面 是 ioct1 
的 原型 : 

#include <unistd.h> 


int ioctl(int fildes, int cmd, ...); 

ioct1 对 描述 符 fildes 引 用 的 对 象 执行 cna 参 数 中 给 出 的 操作 。 根据 特 定 设备 所 支持 操作 的 不 同 ， 
它 还 可 能 会 有 一 个 可 选 的 第 三 参数 。 

例如 ， 在 Linux 系 统 上 对 ioct1 的 如 下 调用 将 打开 键盘 上 的 LED 灯 : 


ioctl(tty fd, KDSETLED, LED_NUM|LED_CAP |LED_SCR) ; 


* Ww 一 个 文件 复制 程序 


在 学 习 了 关于 open 、reaa 和 write 系统 调用 的 知识 以 后 ， 我 们 来 编写 一 个 底层 程序 
copy_system.c， 用 来 逐个 字符 地 把 一 个 文件 复制 到 另外 一 个 文件 。 

在 本 章 中 ， 我 们 将 采用 多 种 方法 来 完成 这 一 工作 ， 以 比较 各 种 方法 的 执行 效率 。 为 简单 起 见 ， 我 们 
将 假设 输入 文件 已 经 存在 ， 输 出 文件 不 存在 ， 并 且 所 有 的 读 写 操作 都 成 功 。 当 然 ， 在 实际 程序 里 ， 我 们 
必须 检验 这 些 假设 是 否 成 立 ! 

(1) 首先 ， 你 需要 有 一 个 用 于 测试 的 输入 文件 ， 长 度 为 IMB， 取 名 为 file. in。 

(2) 然后 编译 copy_system.c: 

#include <unistd.h> 

#include «sys/stat.h» 


#include «fcntl.h» 
#include <stdlib.h> 


int main() 
( 
char c; 
int in, out; 


in = open(*file.in*, O RDONLY); 
out = open(*file.out", O WRONLY|O CREAT, S IRUSR|S. IWUSR); 
while(read(in,&c,l1) == 1) 

write(out,&c,1); 





exit(0); 


注意 ，#include <unista.h> 行 必须 首先 出 现 ， 因 为 它 定义 的 与 POSIX 规 范 有 关 的 标志 
可 能 会 影响 到 其 他 的 头 文件 
(3) 运行 这 个 程序 ， 将 得 到 如 下 的 输出 结果 : 
$ TIMEFORMAT="" time ./copy system 
4.67user 146.90system 2:32.57elapsed 99%CPU 


$ 1s -1s file.in file.out 
1029 -rw-r- 1 neil users 1048576 Sep 17 10:46 file.in 
1029 -rw--- 1 neil users 1048576 Sep 17 10:51 file.out 








88 — $3* 文件 操作 


我 们 在 这 里 使 用 cime 工 具 对 这 个 程序 的 运行 时 间 进行 了 测算 。Linux 使 用 rIMEFORMAT 变 量 来 重 置 默 
认 的 POSIX 时 间 输 出 格式 ，POSIX 时 间 格式 不 包括 CPU 使 用 率 。 你 可 以 看 到 在 这 台 相 当 老 的 系统 上 ，1MB 
的 输入 文件 file.in 被 成 功 复制 到 file.out， 后 者 只 允许 属 主 拥有 读 写 权限 。 但 这 次 复制 花费 了 大 约 两 
分 半 钟 ， 并 且 几 乎 消耗 了 所 有 的 CPU 时 间 。 之 所 以 这 么 慢 ， 是 因为 它 必须 完成 超过 两 百 万 次 的 系统 调用 。 

近 些 年 来 ，Linux 在 系统 调用 和 文件 系统 性 能 方面 有 了 很 大 改善 。 一 个 类 似 的 测试 在 Linux 2.6 内 核 
下 只 需 不 到 14 秒 就 完成 了 。 


$ TIMEFORMAT-"" time ./copy system 
2.08user 10.59system 0:13.74elapsed 92%CPU 





*w 另 一 个 文件 复制 程序 


你 可 以 通过 复制 大 一 些 的 数据 块 来 改善 效率 较 低 的 问题 ， 请 看 下 面 这 个 改进 后 的 程序 copy_block.c， 
它 每 次 复制 长 度 为 IK 的 数据 块 ， 用 的 还 是 系统 调用 : 

#include <unistd.h> 

#include <sys/stat.h> 

#include <fcntl.h> 

#include <stdlib.h> 





int main() 


char block[1024]; 
int in, out; 
int nread; 


in = open(*file.in*, O RDONLY); 

out = open("file.out*, O WRONLY|O CREAT, S IRUSR|S.IWUSR); 

while((nread = read(in,block,sizeof(block))) > 0) 
write(out,block,nread); 


exit(0); 

) 

先 删除 旧 的 输出 文件 ， 然 后 运行 这 个 程序 ; 

$ rm file.out 

$ TIMEFORMAT="" time ./copy block 
0.00user 0.02system 0:00.04elapsed 78%CPU 


实验 解析 

改进 后 的 程序 只 花费 了 百 分 之 几 秒 的 时 间 ， 因 为 它 只 需 做 大 约 2 000 次 系统 调用 。 当 然 ， 这 些 时 间 
与 系统 本 身 的 性 能 有 很 大 的 关系 ， 但 它们 确实 显示 了 系统 调用 需要 巨大 的 开支 ， 因 此 值得 对 其 使 用 进 
行 优化 。 





3.4.5 ”其 他 与 文件 管理 有 关 的 系统 调用 
还 有 许多 其 他 的 系统 调用 能 够 操作 这 些 底层 文件 描述 符 。 通 过 它们 ， 程 序 可 以 控制 文件 的 使 用 方 
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式 和 返回 文件 的 状态 信息 。 

1. lseek 系 统 调用 

lseek 系 统 调用 对 文件 描述 符 filaes 的 读 写 指针 进行 设置 。 也 就 是 说 ， 你 可 以 用 它 来 设置 文件 的 
下 一 个 读 写 位 置 。 读 写 指针 既 可 被 设置 为 文件 中 的 某 个 绝对 位 置 ， 也 可 以 把 它 设置 为 相对 于 当前 位 置 
或 文件 尾 的 某 个 相对 位 置 。 

#include <unistd.h> 

#include <sys/types.h> 

off_t lseek(int fildes, off_t offset, int whence); 

offset 参 数 用 来 指定 位 置 ， 而 whence 参 数 定义 该 偏 移 值 的 用 法 。whence 可 以 取 下 列 值 之 一 。 

口 SEEK_SET: offset 是 一 个 绝对 位 置 。 

O SEEK_CUR: offset 是 相对 于 当前 位 置 的 一 个 相对 位 置 。 

O sEEK END: offset 是 相对 于 文件 尾 的 一 个 相对 位 置 。 

lseek 返 回 从 文件 头 到 文件 指针 被 设置 处 的 字 节 偏 移 值 , 失败 时 返回 -1。 参数 of fset 的 类 型 off_t 
是 一 个 与 具体 实现 有 关 的 整数 类 型 ， 它 定义 在 头 文件 sys/types.h 中 。 
stat 和 1stat 系 统 调用 

fstat 系 统 调用 返回 与 打开 的 文件 描述 符 相 关 的 文件 的 状态 信息 ， 该 信息 将 会 写 到 一 个 buf 结 构 
中 ，buf 的 地 址 以 参数 形式 传递 给 Escac。 

下 面 是 它们 的 原型 : 

#include <unistd.h> 


#include «sys/stat.h» 
#include <sys/types.h> 





int fstat(int fildes, struct stat *buf); 
int stat(const char *path, struct stat *buf); 
int lstat(const char *path, struct stat *buf); 


注意 : 包含 头 文件 sys/types.h 是 可 选 的 ， 但 由 于 一 些 系统 调用 的 定义 针对 那些 某 天 可 
能 会 做 出 调整 的 标准 类 型 使 用 了 别名 ， 所 以 但 在 程序 中 使 用 系统 调用 时 ， 我 们 还 是 推荐 将 这 
个 头 文件 包含 进去 . 
相关 函数 scat 和 1stat 返 回 的 是 通过 文件 名 查 到 的 状态 信息 。 它 们 产生 相同 的 结果 ， 但 当 文件 是 
-个 符号 链接 时 ，1stat 返 回 的 是 该 符号 链接 本 身 的 信息 ， 而 stat 返 回 的 是 该 链接 指向 的 文件 的 信息 。 
stat 结 构 的 成 员 在 不 同 的 类 UNIX 系 统 上 会 有 所 变化 ， 但 一 般 会 包括 表 3-4 中 所 示 的 内 容 。 














表 34 
tat 成员 说 明 
st_mode 文件 权限 和 文件 类 型 信息 
与 该 文件 关联 的 inode 
保存 文件 的 设备 
文件 属 主 的 UID 号 


文件 属 主 的 GID 号 

文件 上 一 次 被 访问 的 时 间 

文件 的 权限 、 属 主 、 组 或 内 容 上 一 次 被 改变 的 时 间 
文件 的 内 容 上 一 次 被 修改 的 时 间 

该 文件 上 硬 链接 的 个 数 
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stat 结 构 中 返回 的 st_mode 标 志 还 有 一 些 与 之 关联 的 宏 , 它们 定义 在 头 文件 sys/stat .h 中 。 这些 
宏 包 括 对 访问 权限 、 文 件 类 型 标志 以 及 一 些 用 于 帮助 测试 特定 类 型 和 权限 的 掩 码 的 定义 。 

访问 权限 标志 与 前 面 介 绍 的 open 系 统 调用 中 的 内 容 是 一 样 的 。 文 件 类 型 标志 如 下 所 示 。 

口 s_IFBLK: 文件 是 一 个 特殊 的 块 设备 。 

口 s_IFDIR: 文件 是 一 个 目录 。 

口 s_IFCHR: 文件 是 一 个 特殊 的 字符 设备 。 

口 s_IFIFO: 文件 是 一 个 FIFO (命名 管道 )。 

O s_IFREG: 文件 是 一 个 普通 文件 。 

口 s_FLNK: 文件 是 一 个 符号 链接 。 

以 下 是 其 他 模式 标志 。 

Us su 文件 设置 了 suUID 位 。 

口 s_IsGID: 文件 设置 了 sGID 位 。 

下 面 列 出 了 用 于 解释 st_mode 标 志 的 掩 码 。 

口 s_IFMT: 文件 类 型 。 

口 s_IRWXU: 属 主 的 读 / 写 /执行 权限 。 

O S_IRWXG: 属 组 的 读 / 写 /执行 权限 。 

O s rmwxo:. 其 他 用 户 的 读 / 写 /执行 权限 。 
` 面 是 一 些 用 来 帮助 确定 文件 类 型 的 宏 定义 。 它 们 只 是 对 经 过 掩 码 处 理 的 模式 标志 和 相应 的 设备 
类 型 标志 进行 比较 。 

O S_ISBLK: 测试 是 否 是 特殊 的 块 设备 文件 。 

O s_IscHR: 测试 是 否 是 特殊 的 字符 设备 文件 。 

口 s_ISDIR: 测试 是 否 是 目录 。 

口 s_ISFIFO: 测试 是 否 是 FIFO。 

Us rsREG: 测试 是 否 是 普通 文件 。 

O S_ISLNK: 测试 是 否 是 符号 链接 。 

例如 ， 如 果 想 测试 一 个 文件 代表 的 不 是 一 个 目录 , 设置 了 属 主 的 执行 权限 ,并且 不 再 有 其 他 权限 ， 
你 可 以 使 用 如 下 的 代码 进行 测试 : 

struct stat statbuf; 

mode t modes; 





stat("filename",&statbuf); 
modes = statbuf.st mode; 


if(!S ISDIR(modes) && (modes & S IRWXU) -- S IXUSR) 


3. dup 和 dup2 系 统 调用 

dup 系 统 调用 提供 了 一 种 复制 文件 描述 符 的 方法 ， 使 我 们 能 够 通过 两 个 或 者 更 多 个 不 同 的 描述 符 
来 访问 同一 个 文件 。 这 可 以 用 于 在 文件 的 不 同位 置 对 数据 进行 读 写 。aup 系 统 调用 复制 文件 描述 符 
fildes， 返 回 一 个 新 的 描述 符 。dup2 系 统 调用 则 是 通过 明确 指定 目标 描述 符 来 把 一 个 文件 描述 符 复 
制 为 另外 一 个 。 

它们 的 原型 如 下 : 
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#include «unistd.h» 

int dup(int fildes); 

int dup2(int fildes, int fildes2); 

当 你 通过 管道 在 多 个 进程 间 进 行 通信 时 ， 这 些 调用 也 很 有 用 。 我 们 将 在 第 13 章 对 aup 系 统 调用 进 
行 深入 讨论 。 


3.5 标准 1/O 库 


标准 UO 库 (stdio》 及 其 头 文件 staio.h 为 底层 /O 系 统 调用 提供 了 一 个 通用 的 接口 。 这 个 库 现 在 
已 经 成 为 ANSI 标 准 C 的 一 部 分 , 而 你 前 面 见 到 的 系统 调用 却 还 不 是 。 标准 VO 库 提供 了 许多 复杂 的 函数 
用 于 格式 化 输出 和 扫描 输入 。 它 还 负责 满足 设备 的 缓冲 需求 。 
在 很 多 方面 ,你 使 用 标准 MO 库 的 方式 和 使 用 底层 文件 描述 符 一 样 。 你 需要 先 打开 一 个 文件 以 建立 
-个 访问 路 径 。 这 个 操作 的 返回 值 将 作为 其 他 IO 库 函 数 的 参数 。 在 标准 1O 库 中 ， 与 底层 文件 描述 符 
对 应 的 是 流 〈stream)， 它 被 实现 为 指向 结构 FILE 的 指针 。 
注意 ， 不 要 把 这 里 的 文件 流 与 C++ 语言 中 的 输入 输出 流 (iostream) 以 及 AT&T UNIX 
System V Release 3 中 引入 的 进程 间 通 信 中 的 STREAMS 模 型 相 混淆 ，STEAMS 模 型 不 在 本 书 
的 讨论 范围 之 内 . 要 想 进一步 了 解 STREAMS, 请 查阅 X/Open 规范 ( http://www.opengroup.org ) 
fe System V 版 本 一 起 提供 的 4T&TSTREAMS Programming Guide (《AT&T STREAMS 程 序 设 
计 指 南 》)。 


在 启动 程序 时 , 有 3 个 文件 流 是 自动 打开 的 。 它 们 是 stain、stGout 和 staerr。 它们 都 是 在 stdio.h 
头 文件 里 定义 的 ， 分 别 代 表 着 标准 输入 、 标 准 输出 和 标准 错误 输出 ， 与 底层 文件 描述 符 9、1 和 2 相对 
应 。 

在 本 节 里 ， 我 们 将 介绍 标准 UO 库 中 的 下 列 库 函数 : 

口 fopen、fclose 

O fread, fwrite 

口 fflush- 

口 fseek- 

口 fgetc、getc、getchar 

O fputc. putc. putchar 

O fgets, gets 

O printf, fprintfflsprintf 

O scanf, fscanf 和 sscanf 
3.5.1 fopen 函数 

fopen 库 函数 类 似 于 底层 的 open 系 统 调用 。 它 主要 用 于 文件 和 终端 的 输入 输出 。 如 果 你 需要 对 设 
备 进行 明确 的 控制 ， 那 最 好 使 用 底层 系统 调用 ， 因 为 这 可 以 避免 用 库 函 数 带 来 的 一 些 潜在 问题 ， 如 输 
入 /输出 缓冲 。 

该 函数 原型 如 下 : 


finclude «stdio.h» 


FILE *fopen(const char *filename, const char *mode); 
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fopen 打 开 由 filename 参 数 指定 的 文件 ， 并 把 它 与 一 个 文件 流 关联 起 来 . mode 参 数 指定 文件 的 打 
开 方 式 ， 它 取 下 列 字符 串 中 的 值 。 

口 "r" 或 "rzb": 以 只 读 方式 打开 。 

O "w" 或 "wb": 以 写 方式 打开 ， 并 把 文件 长 度 截 短 为 零 。 

口 "a" 或 "ab": 以 写 方式 打开 ， 新 内 容 追 加 在 文件 尾 。 

口 "r+" 或 "rb+" 或 "r+b": 以 更 新 方式 打开 〈 读 和 写 )。 

口 "w+ "或 "wb+" 或 "wrb": 以 更 新 方式 打开 ， 并 把 文件 长 度 截 短 为 零 。 

口 "a+ "或 "ab+" 或 "arb": 以 更 新 方式 打开 ， 新 内 容 追 加 在 文件 尾 。 

字母 b 表 示 文 件 是 一 个 二 进 制 文件 而 不 是 文本 文件 。 

请 注意 ， UNIX 和 Linux 并 不 像 MS-DOS 那 样 区 分 文本 文件 和 二 进 制 文件 。 UNIX 和 Linux 

把 所 有 文件 都 看 作为 二 进 制 文件 , 另 一 个 需要 注意 的 地 方 是 mode 参 数 , 它 必 须 是 一 个 字符 事 ， 

而 不 是 一 个 字符 。 所 以 总 是 应 该 使 用 双 引 号 ， 而 不 是 单 引号 。 

fopen 在 成 功 时 返回 一 个 非 空 的 FTLE * 指 针 ， 失 败 时 返回 NuLL 值 , NULL 值 在 头 文件 staio.h 里 定义 。 

可 用 的 文件 流 数量 和 文件 描述 符 一 样 ， 都 是 有 限制 的 。 实际 的 限制 是 由 头 文件 staio.h 中 定义 的 
FOPEN_MAX 来 定义 的 ， 它 的 值 至 少 为 8， 在 Linux 系 统 中 ， 通 常 是 16。 
3.52 fread 函数 

fread 库 函数 用 于 从 一 个 文件 流 里 读 取 数 据 。 数 据 从 文件 流 seream 读 到 由 ptz 指 向 的 数据 缓冲 区 
里 。fread 和 fwrice 都 是 对 数据 记录 进行 操作 ，size 参 数 指定 每 个 数据 记录 的 长 度 ， 计 数 器 nitems 
给 出 要 传输 的 记录 个 数 。 它 的 返回 值 是 成 功 读 到 数据 缓冲 区 里 的 记录 个 数 〈 而 不 是 字 节 数 )。 当 到 达 
文件 尾 时 ， 它 的 返回 值 可 能 会 小 于 nicems， 甚 至 可 以 是 零 。 

该 函数 原型 如 下 : 

#include <stdio.h> 

size t fread(void *ptr, size t size, size t nitems, FILE *stream); 

对 所 有 向 缓冲 区 里 写 数据 的 标准 MO 函数 来 说 , 为 数据 分 配 空间 和 检查 错误 是 程序 员 的 责任 。 请 参 
见 本 章 后 面 对 ferror 和 feof 函 数 的 介绍 。 
3.5.3 fwrite 函数 

fwrite 库 函数 与 treaa 有 相似 的 接口 。 它 从 指定 的 数据 缓冲 区 里 取出 数据 记录 ， 并 把 它们 写 到 输 
出 流 中 。 它 的 返回 值 是 成 功 写 入 的 记录 个 数 。 

该 函数 原型 如 下 ， 

#include <stdio.h> 


size t fwrite (const void *ptr, size t size, size t nitems, FILE *stream); 


请 注意 ， 我 们 不 推荐 把 EreaG 和 fwrite 用 于 结构 化 数据 。 部 分 原因 在 于 用 fwrite 写 的 文 
件 在 不 同 的 计算 机 体系 结构 之 间 可 能 不 具备 可 移植 性 。 


3.5.4 fclose 函数 
fclose 库 函数 关闭 指定 的 文件 流 stream， 使 所 有 尚未 写 出 的 数据 都 写 出 。 因 为 staio 库 会 对 数据 
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进行 缓冲 ， 所 以 使 用 fclose 是 很 重要 的 。 如 果 程 序 需要 确保 数据 已 经 全 部 写 出 ， 就 应 该 调用 fclose 
函数 。 虽然 当 程序 正常 结束 时 ,会 自动 对 所 有 还 打开 的 文件 流 调用 fclose 函 数 ， 但 这 样 做 你 就 没有 机 
会 检查 由 fclose 报 告 的 错误 了 。 

该 函数 原型 如 下 : 


#include «stdio.h» 


int fclose(FILE *stream); 


3.5.5 fflush 函数 


fflush 库 函数 的 作用 是 把 文件 流 里 的 所 有 未 写 出 数据 立刻 写 出 。 例如 ， 你 可 以 用 这 个 函数 来 确保 
在 试图 读 入 一 个 用 户 响应 之 前 ， 先 向 终端 送出 一 个 交互 提示 符 。 使 用 这 个 函数 还 可 以 确保 在 程序 继续 
执行 之 前 重要 的 数据 都 已 经 被 写 到 磁盘 上 。 有 时 在 调试 程序 时 ， 你 还 可 以 用 它 来 确认 程序 是 正在 写 数 
据 而 不 是 被 挂 起 了 。 注 意 ， 调 用 fclose 函 数 隐 含 执行 了 一 次 flush 操 作 ， 所 以 你 不 必 在 调用 fclose 之 
前 调用 fflush。 

该 函数 原型 如 下 : 

#include «stdio.h» 


int fflush(FILE *stream); 


3.5.6 fseek 函数 


fseek 函 数 是 与 1seek 系 统 调 用 对 应 的 文件 流 函 数 。 它 在 文件 流 里 为 下 一 次 读 写 操作 指定 位 置 。 
offset 和 whence 参 数 的 含义 和 取 值 与 前 面 的 lseex 系 统 调用 完全 一 样 。 但 1seek 返 回 的 是 一 个 off_t 
数值 ， 而 fseek 返 回 的 是 一 个 整数 : 0 表示 成 功 ，-1 表 示 失 败 并 设置 errno 指 出 错误 。 

该 函数 原型 如 下 : 

#include <stdio.h> 





int fseek(FILE *stream, long int offset, int whence); 
3.5.7 fgetc. getc 和 getchar 函数 


fgetc 函 数 从 文件 流 里 取出 下 一 个 字 节 并 把 它 作为 一 个 字符 返回 。 当 它 到 达 文件 尾 或 出 现 错误 时 ， 
它 返回 BoF。 你 必须 通过 ferror 或 feof 来 区 分 这 两 种 情况 。 
这 些 函 数 的 原型 如 下 : 


#include <stdio.h> 





int fgetc(FILE *stream); 
int getc(FILE *stream); 
int getchar(); 


getc 函 数 的 作用 和 fgetc 一 样 ， 但 它 有 可 能 被 实现 为 一 个 宏 ， 如 果 是 这 样 ，stream 参 数 就 可 能 被 
计算 不 止 一 次 ， 所 以 它 不 能 有 副作用 例如， 它 不 能 影响 变量 )。 此 外 ， 你 也 不 能 保证 能 够 使 用 getc 
的 地 址 作为 一 个 函数 指针 。 

getchar 函 数 的 作用 相当 于 getc (stain)， 它 从 标准 输入 里 读 取 下 一 个 字符 。 
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3.5.8 fputc. putc 和 putchar 函数 
fputc 函 数 把 一 个 字符 写 到 一 个 输出 文件 流 中 。 它 返回 写 入 的 值 ， 如 果 失败 ， 则 返回 EoF。 


#include <stdio.h> 
int fputc(int c, FILE *stream); 


int putc(int c, FILE *stream); 
int putchar(int c); 


类 似 于 ftgecc 和 getc 之 间 的 关系 ，putc 函 数 的 作用 也 相当 于 fputc， 但 它 可 能 被 实现 为 一 个 宏 。 

putchar 函 数 相当 于 putc (c，staout)， 它 把 单个 字符 写 到 标准 输出 。 注意， putchar 和 和 getchar 
都 是 把 字符 当 作 int 类 型 而 不 是 char 类 型 来 使 用 的 。 这 就 允许 文件 尾 EoF) 标识 取 值 -1， 这 是 一 个 
超出 字符 数字 编码 范围 的 值 。 


3.5.9 fgets 和 gets 函数 


fgets 函 数 从 输入 文件 流 scream 里 读 取 一 个 字符 串 。 

#include <stdio.h> 

Char *fgets(char *s, int n, FILE *stream); 

char * (char *s); 

fgets 把 读 到 的 字符 写 到 s 指 向 的 字符 串 里 , 直到 出 现下 面 某 种 情况 : 过 到 换行 符 ， 已 经 传输 了 n-1 
个 字符 ,或 者 到 达 文 件 尾 。 它 会 把 过 到 的 换行 符 也 传递 到 接收 字符 串 里 再 加 上 一 个 表示 结尾 的 空 字 
节 \0。 一 次 调用 最 多 只 能 传输 a-1 个 字符 ， 因 为 它 必须 把 空 字 节 加 上 b CET. 
完成 时 ，fgecs 返 回 一 个 指向 字符 串 s 的 指针 。 如 果 文件 流 已 经 到 达 文件 尾 ， fgets 会 设置 
这 个 文件 流 的 EOP 标识 并 返回 一 个 空 指针 。 如 果 出 现 读 错 误 ，fgets 返 回 -个 空 指针 并 设置 errno 以 指 
出 错误 的 类 型 。 

gets 函 数 类 似 于 fgets， 只 不 过 它 从 标准 输入 读 取 数据 并 丢弃 过 到 的 换行 符 。 它 在 接收 字符 串 的 
尾部 加 上 一 个 nul1 字 节 。 

注意 : gets 对 传输 字符 的 个 数 并 没有 限制 ， 所 以 它 可 能 会 溢出 自 己 的 传输 缓冲 区 . 因此 ， 
你 应 该 避免 使 用 它 并 用 aec RE. R$ 安全 问题 都 可 以 追溯 到 在 程序 中 使 用 了 可 能 造成 
各 种 缓冲 区 溢出 的 函数 ，gets 就 是 一 个 这 样 的 函数 ， 所 以 千 万 要 小 心 ! 


3.6 ”格式 化 输入 和 输出 


如 果 你 曾经 用 C 语 言 编写 过 程序 ， 那么 你 应 该 对 那些 按 设 计 格式 输出 数据 的 库 函 数 比较 熟悉 。 这 
些 函 数 包 括 向 一 个 文件 流 输出 数据 的 printf 系 列 函数 和 从 -个 文件 流 读 取 数 据 的 scanf 系 列 函 数 。 
3.6.1 printf, fprintf 和 sprintf 函数 

printf 系 列 函数 能 够 对 各 种 不 同类 型 的 参数 进行 格式 编排 和 输出 。 每 个 参数 在 输出 流 中 的 表示 形 
式 由 格式 参数 format 控 制 ， 它 是 一 个 包含 需要 输出 的 普通 字符 和 称 为 转换 控制 符 代码 的 字符 串 ， 转 换 


控制 符 规定 了 其 余 的 参数 应 该 以 何 种 方式 被 输出 到 何 种 地 方 。 
#include <stdio.h> 
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int printf(const char *format, ...); 
int sprintf(char *s, const char *format, ...); 
int fprintf(FILE *stream, const char *format, ...); 


printf 函 数 把 自己 的 输出 送 到 标准 输出 。fprintf 函 数 把 自己 的 输出 送 到 一 个 指定 的 文件 流 。 
sprinf 函 数 把 自己 的 输出 和 一 个 结尾 空 字符 写 到 作为 参数 传递 过 来 的 字符 串 s 里 。 这 个 字符 串 必 须 是 
够 容纳 所 有 的 输出 数据 。 

printf 系 列 消 数 还 有 一 些 其 他 的 成 员 , 它 们 以 各 自 不 同 的 方式 对 其 参数 进行 处 理 。 更 详细 的 资料 
请 参考 printE 的 手册 页 。 

兽 通 字 符 在 输出 时 不 发 生变 化 .转换 控制 符 让 printf 取 出 传递 过 来 的 其 他 参数 并 对 它们 的 格式 进 
行 编排 。 转 换 控制 符 总 是 以 8 字符 开头 。 下 面 是 一 个 简单 的 例子 : 

printf("Some numbers: $d, %d, and %d\n’, 1, 2, 3); 

它 在 标准 输出 上 产生 如 下 的 输出 : 

Some numbers: 1, 2, and 3 


要 想 输 出 s 字 符 ， 你 需要 使 用 %#$， 这 样 就 不 会 与 转换 控制 符 混淆 了 。 

下 面 是 一 些 常用 的 转换 控制 符 。 

口 $G，%i; 以 十 进 制 格 式 输出 一 个 整数 。 

O bo, bx: 以 八进制 或 十 六 进 制 格式 输出 一 个 整数 。 

口 sc: 输出 一 个 字符 。 

口 ss， 输 出 一 个 字符 串 。 

口 sf: 输出 一 个 〈 单 精度 ) 浮 点 数 。 

O ge: 以 科学 计数 法 格式 输出 一 个 双 精度 浮 点 数 。 

Oso: 以 通用 格式 输出 一 个 双 精 度 浮 点 数 。 

让 传递 到 print# 函 数 里 的 参数 数目 和 类 型 与 format 字 符 串 里 的 转换 控制 符 相 匹 配 是 非常 重要 
的 。 整 数 参数 的 类 型 可 以 用 一 个 可 选 的 长 度 限定 符 来 指定 。 它 可 以 是 hb， 例如 sha 表 示 这 是 一 个 短 整 数 
(short int)， 或 者 1， 例 如 816 表 示 这 是 一 个 长 整数 (long int)。 有 的 编 详 器 能 够 对 printf 语 句 进 
行 检查 ,但 并 非 万 无 一 失 。 如 果 你 使 用 的 是 GNU 编 译 嚣 gcc， 你 可 以 在 编译 命令 中 添加 -wformat 选 项 
以 实现 这 一 功能 。 

下 面 是 另外 一 个 例子 : 

char initial = 


char *surname = "Matthew"; 
double age = 13.5; 





printf(*Hello Mr èc $s, aged %g\n", initial, surname, age); 

它 的 输出 是 : 

Hello Mr A Matthew, aged 13.5 

你 可 以 利用 字段 限定 符 对 数据 的 输出 格式 做 进一步 的 控制 。 它 扩展 了 转换 控制 符 的 功能 ， 使 得 转 
换 控制 符 能 够 对 输出 数据 的 间隔 进行 控制 。 它 的 常见 用 法 是 设置 浮 点 数 的 小 数位 数 或 设置 字符 串 两 端 
的 空格 数 。 

字段 限定 符 是 转换 控制 符 里 紧 跟 在 * 字 符 后 面 的 数字 。 表 3-5 中 列 出 了 一 些 转换 控制 符 示 例 及 其 输 
出 情况 。 为 了 说 明 得 更 清楚 ， 我 们 用 垂直 线 字符 来 表示 输出 边界 。 
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* 3-5 
m ox 参 数 | 输 出 | 
%10s "Hello" Hellol 
$-108 "Hello* IHello 1 
*10d 1234 1 12341 
3-10d 1234 1234 1 
$0108 1234 10000001234 1 
$10.4f 12.34 1 12.34001 
sts 10, "Hello" 1 Hellol 





上 表 中 的 所 有 示例 都 输出 到 一 个 10 个 字符 宽 的 区 域 里 。 注 意 : 负 值 的 字段 宽度 表示 数据 在 该 字段 
里 以 左 对 齐 的 格式 输出 。 可 变 字段 宽度 用 一 个 星 号 (*) 来 表示 。 在 这 种 情况 下 ， 下 一 个 参数 用 来 表 
示 字段 宽 。$ 字 符 后 面 以 0 开头 表示 数据 前 面 要 用 数字 0 填充 。 根 据 POSIX 规 范 的 要 求 ，printf 不 对 数 
据 字段 进行 截断 ， 而 是 扩充 数据 字段 以 适应 数据 的 宽度 。 因 此 ， 如 果 你 想 打印 一 个 比 字段 宽度 长 的 字 
符 串 ， 数 据 字段 会 加 宽 ， 如 表 3-6 所 示 。 





表 3-6 
m ox 5 R | 输 出 | 
30s cTherePeeps" | HelloTherePeeps. 
printf 函 数 返回 一 个 整数 以 表明 它 输出 的 字符 个 数 。 但 在 sprint 5 的 返回 值 里 没有 算 上 结尾 的 那 
个 nul1 空 字符 。 如 果 发 生 错 误 ， 这 些 函数 会 返回 一 个 负 值 并 设置 errno。 
3.6.2 scanf. fscanf 和 sscanf 函数 
scanf 系 列 函数 的 工作 方式 与 printf 系 列 函 数 很 相似 ， 只 是 前 者 的 作用 是 从 一 个 文件 流 里 读 取 数 
据 ， 并 把 数据 值 放 到 以 指针 参数 形式 传递 过 来 的 地 址 处 的 变量 中 。 它 们 也 使 用 一 个 格式 字符 串 来 控制 
输入 数据 的 转换 ， 它 所 使 用 的 许多 转换 控制 符 都 与 printf 系 列 函数 的 一 样 。 


#include «stdio.h» 











int scanf(const char *format, ...); 
int fscanf(FILE *stream, const char *format, ...); 
int sscanf(const char *s, const char *format, ...); 


scanf 函 数 读 入 的 值 将 保存 到 对 应 的 变量 里 去 ， 这 些 变 量 的 类 型 必须 正确 ， 并 且 它 们 必须 精确 匹 
配 格式 字符 串 。 耕 则 ， 内 存 数据 就 可 能 会 遭 到 破坏 ， 从 而 使 程序 出 省。 编译 器 是 不 会 对 此 做 出 错误 提 
示 的 ， 但 如 果 你 运气 够 好 ， 你 可 能 会 看 到 一 个 警告 信息 ! 

scanf 系 列 函数 的 format 格 式 字符 串 里 同时 包含 着 普通 字符 和 转换 控制 符 , 就 像 printf 函 数 中 一 
样 。 但 在 scanf 系 列 函数 中 ， 那 些 普 通 字符 是 用 于 指定 在 输入 数据 里 必须 出 现 的 字符 。 

下 面 是 一 个 简单 的 例子 : 

int num; 

scanf ("Hello %d", &num); 


这 个 scanf 调 用 只 有 在 标准 输入 中 接 下 来 的 五 个 字符 匹配 *Hello* 的 情况 下 才 会 成 功 。 然 后 ， 如 
果 后 面 的 字符 构成 了 一 个 可 识别 的 十 进 制 数字 ， 该 数字 就 将 被 读 入 并 赋值 给 变量 num。 格 式 字符 串 中 
的 空格 用 于 忽略 输入 数据 中 位 于 转换 控制 符 之 间 的 各 种 空白 字符 空格 、 制 表 符 、 换 页 符 和 换行 符 )。 
这 意味 着 在 下 面 两 种 输入 情况 下 ， 这 个 scanf 调 用 都 会 执行 成 功 ， 并 把 1234 放 到 变量 num 里 : 
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Hello 1234 
Hellol234 


输入 的 空白 字符 在 进行 数据 转换 时 一 般 也 会 被 忽略 。 这 意味 着 ， 格 式 字符 串 $a 将 持续 读 取 输入 ， 
忽略 空格 和 换行 符 , 直到 找到 一 组 数字 为 止 .如 果 预 期 的 字符 没有 在 输入 流 里 出 现 , 转换 将 失败 , scanf 
也 将 返回 。 

如 果 不 注意 ， 这 会 产生 问题 。 如果 用 户 在 输入 中 应 该 出 现 一 个 整数 的 地 方 放 的 是 一 个 非 

数字 字符 ， 就 可 能 在 程序 里 导致 一 个 无 限 循环 - 

下 面 是 一 些 其 他 的 转换 控制 符 。 

口 $6: 读 取 一 个 十 进 制 整数 。 

口 $0o、%x: 读 取 一 个 八进制 或 十 六 进 制 整数 。 

OQ $f. $e. bg: 读 取 一 个 浮 点 数 。 

Osc: 读 取 一 er (不 会 忽略 空格 )。 


| 








读 取 -个 字符 集合 〈 见 下 面 的 说 明 )。 

ü ss 读 取 一 个 $ 字 符 。 

类 似 于 princf，scanf 的 转换 控制 符 里 也 可 以 加 上 对 输入 数据 字段 宽度 的 限制 。 长 度 限 定 符 〈h 
对 应 于 短 ，1 对 应 于 长 ) 指明 接收 参数 的 长 度 是 否 比 默认 情况 更 短 或 更 长 。 这 意味 着 ，%ha 表 示 要 读 入 
-个 短 整数 ，%16G 表 示 要 读 入 一 个 长 整数 ， 而 $1g 表 示 要 读 入 一 个 双 精 度 浮 点 数 。 

以 星 号 (*) 开头 的 控制 符 表 示 对 应 位 置 上 的 输入 数据 将 被 忽略 。 这 意味 着 ， 这 个 数据 不 会 被 保 
存 ， 因 此 不 需要 使 用 一 个 变量 来 接收 

我 们 使 用 %c 控 制 符 从 输入 中 读 取 一 个 字符 。 它 不 会 跳 过 起 始 的 空白 字符 。 

我 们 使 用 ss 控制 符 来 扫描 字符 串 ， 但 使 用 时 必须 小 心 。 它 会 跳 过 起 始 的 空白 字符 ， 并 且 会 在 字符 
串 里 出 现 的 第 一 个 空白 字符 处 停 下 来 ， 所 以 ， 你 最 好 用 它 来 读 取 单 词 而 不 是 一 般 意义 上 的 字符 串 。 此 
外 ， 如 果 没 有 使 用 字段 宽度 限定 符 ， 它 能 够 读 取 的 字符 串 的 长 度 是 没有 限制 的 ， 所 以 接收 字符 串 必须 
有 足够 的 空间 来 容纳 输入 流 中 可 能 的 最 长 字符 串 。 较 好 的 选择 是 使 用 一 个 字段 限定 符 ， 或 者 结合 使 用 
fgets 和 sscanft 从 输入 中 读 入 一 行 数据 ， 再 对 它 进行 扫描 。 这 样 可 以 避免 可 能 被 恶意 用 户 利用 的 缓冲 
区 溢出 。 

我 们 使 用 %[] 控 制 符 读 取 由 一 个 字符 集合 中 的 字符 构成 的 字符 串 。 格 式 字 符 串 $[A-z] 将 读 取 一 个 
由 大 写字 母 构成 的 字符 串 。 如 果 字符 集中 的 第 一 个 字符 是 ^， 就 表示 将 读 取 一 个 由 不 属于 该 字符 集合 
中 的 字符 构成 的 字符 串 。 因 此 ， 读 取 一 个 其 中 带 空格 的 字符 串 ， 并 且 在 遇 到 第 一 个 逗号 时 停止 ， 你 可 
以 用 %[^,]。 

给 定 下 面 输入 行 : 

Hello, 1234, 5.678, X, string to the end of the line 

下 面 的 scanf 调 用 会 正确 读 入 4 个 数据 项 : 

char s[256]; 

int n; 


float f; 
char c; 








scanf ("Hello, %d,%g, $c, &[^W]*, &n,&f,&c,s); 
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scanf 函 数 的 返回 值 是 它 成 功 读 取 的 数据 项 个 数 ， 如 果 在 读 第 一 个 数据 项 时 失败 了 ， 它 的 返回 值 
就 将 是 零 。 如 果 在 匹配 第 一 个 数据 项 之 前 就 已 经 到 达 了 输入 的 结尾 ， 它 就 会 返回 Po。 如果 文件 流 发 
生 读 错误 ， 流 错误 标志 就 会 被 设置 并 且 错误 变量 errno 将 被 设置 以 指明 错误 类 型 。 详 细 情 况 请 参考 本 
章 3.6.4 节 中 的 内 容 。 

一 般 来 说 ， 对 scanf 系 列 函数 的 评价 并 不 高 ， 这 主要 有 下 面 3 方面 原因 。 

口 从 历史 来 看 ， 它 们 的 具体 实现 都 有 漏洞 。 

O 它们 的 使 用 不 够 灵活 。 

口 使 用 它们 编写 的 代码 不 容易 看 出 究竟 正在 解析 什么 。 

此 外 ， 你 应 尝试 使 用 其 他 函数 ， 如 freaa 或 fgecs 来 读 取 输入 行 ， 再 用 字符 串 函数 把 输入 分 解 成 你 
需要 的 数据 项 。 


3.6.3 ”其 他 流 函 数 


stdio 函 数 库 里 还 有 一 些 其 他 的 函数 使 用 流 参数 或 标准 流 srain、stdaout 和 stderr， 如 下 所 示 。 

O fgetpos: 获得 文件 流 的 当前 〈 读 写 ) 位 置 。 

口 fsetpos: 设置 文件 流 的 当前 〈 读 写 ) 位 置 。 

O ftell: 返回 文件 流 当 前 ( 读 写 ) 位 置 的 偏 移 值 。 

O rewind: 重 置 文件 流 里 的 读 写 位 置 。 

口 freopen: 重新 使 用 一 个 文件 流 。 

O setvbut: 设置 文件 流 的 缓冲 机 制 。 

O remove: 相当 于 unlink 函 数 ， 但 如 果 它 的 path 参 数 是 一 个 目录 的 话 ， 其 作用 就 相当 于 rmair 

函数 。 

所 有 这 些 库 函 数 在 手册 页 的 第 三 节 中 都 有 说 明 。 

你 可 以 使 用 文件 流 函 数 来 重新 实现 前 面 的 文件 复制 程序 。 请 看 下 面 的 copy_staio.c 程 序 。 
EN EESTIT 

这 个 程序 与 前 面 的 版 本 很 相似 ， 但 逐个 字符 的 复制 工作 改 为 通过 调用 stdio.h 头 文件 里 定义 的 函 


include <stdio.h> 
#include «stdlib.h» 








int main() 
{ 
int c; 
FILE *in, *out; 


in = fopen('file.in*,'r*); 
out = fopen(*file.out",*w'); 


while((c = fgetc(in)) !- EOF) 
fputc(c,out); 


exit(0); 
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像 前 面 那样 运行 这 个 程序 ， 你 得 到 的 结果 是 : 


$ TIMEFORMAT="" time ./copy stdio 
0.06user 0.02system 0:00.11elapsed B18CPU 


这 一 次 程序 运行 了 0.11 秒 ， 虽 然 不 如 底层 数据 块 复制 版 本 快 ， 但 比 那个 一 次 复制 一 个 字符 的 版 本 
要 快 得 多 。 这 是 因为 seaio 库 在 FILE 结 构 里 使 用 了 一 个 内 部 缓冲 区 ， 只 有 在 缓冲 | 时 才 进 行 底层 系 
统 调用 。 读 者 可 以 利用 staio 库 函数 自行 编写 出 实现 逐 行 复制 和 数据 块 复制 的 程序 ， 将 它们 的 执行 性 
能 与 我 们 在 本 章 里 给 出 的 3 个 示例 程序 进行 比较 。 











3.6.4 ”文件 流 错误 
为 了 表明 错误 , 许多 staio 库 函数 会 返回 一 个 超出 范围 的 值 ， 比 如 空 指针 或 EF 常数。 此 时 ， 错 误 
由 外 部 变量 errno 指 出 : 


#include <errno.h> 
extern int errno; 


注意 ， 许 多 函数 都 可 能 改变 errno 的 值 。 它 的 值 只 有 在 函数 调用 失败 时 才 有 意义 ， 你 必 
须 在 函数 表明 失败 之 后 立刻 对 其 进行 检查 . 你 应 该 总 是 在 使 用 它 之 前 将 它 先 复制 到 另 一 个 变 
量 中 ， 因 为 像 fprintf 这 样 的 输出 函数 本 身 就 可 能 改变 errno 的 值 . 

你 也 可 以 通过 检查 文件 流 的 状态 来 确定 是 否 发 生 了 错误 ， 或 者 是 否 到 达 了 文件 尾 。 
#include <stdio.h> 
int ferror(FILE *stream); 


int feof (FILE *stream); 
void clearerr(FILE *stream); 


ferrorif MIRAE E ER, n Rb UC RUGR I] 4e dESE (IG. BRE, 
feof 函数 测试 一 个 文件 流 的 文件 尾 标识 ， 如 果 该 标识 被 设置 就 返回 非 零 值 ， 否 则 返回 零 。 我 们 可 
以 像 下 面 这 样 使 用 它 : 
if (feof (some_stream) ) 
/* We're at the end */ 


clearerr 函 数 的 作用 是 清除 由 stream 指 向 的 文件 流 的 文件 尾 标识 和 错误 标识 。 它 没有 返回 值 
也 未 定义 任何 错误 。 你 可 以 通过 使 用 它 从 文件 流 的 错误 状态 中 恢复 。 例 如 ， 在 “磁盘 已 满 ”错误 解决 
之 后 ， 继 续 开始 写 入 文件 流 。 
3.6.5 “文件 流 和 文件 描述 符 

每 个 文件 流 都 和 一 个 底层 文件 描述 符 相 关联 。 你 可 以 把 底层 的 输入 输出 操作 与 高 层 的 文件 流 操作 
混合 使 用 ， 但 一 般 来 说 ， 这 并 不 是 一 个 明智 的 做 法 ， 因 为 数据 缓冲 的 后 果 难 以 预料 。 


#include <stdio.h> 





int fileno(FILE *stream); 
FILE *fdopen(int fildes, const char *mode); 
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你 可 以 通过 调用 fileno 函 数 来 确定 文件 流 使 用 的 是 哪个 底层 文件 描述 符 。 它 返回 指定 文件 流 使 用 
的 文件 描述 符 ， 如 失败 就 返回 -1。 如 果 你 需要 对 一 个 己 经 打开 的 文件 流 进行 底层 访问 时 《〈 例 如， 对 它 
调用 fstat )， 这 个 函数 将 很 有 用 。 

你 可 以 通过 调用 fGopen 函 数 在 一 个 己 打开 的 文件 描述 符 上 创建 一 个 新 的 文件 流 。 实质 上 , XXe ER 
数 的 作用 是 为 一 个 已 经 打开 的 文件 描述 符 提供 scaio 缓 冲 区 ， 这 样 解 释 可 能 更 容易 理解 一 些 。 

fdopen 函 数 的 操作 方式 与 topen 函 数 是 一 样 的 ， 只 是 前 者 的 参数 不 是 一 个 文件 名 ， 而 是 一 个 底层 
的 文件 描述 符 。 如 果 你 已 经 通过 open 系 统 调用 创建 了 一 个 文件 可 能 是 出 于 为 了 更 好 地 控制 其 访问 权 
限 的 目的 )， 但 又 想 通过 文件 流 来 对 它 进行 写 操作 ， 这 个 函数 就 很 有 用 了 。fdopen 函 数 的 mode 参 数 与 
fopen 函 数 的 完全 一 样 ， 但 它 必须 符合 该 文件 在 最 初 打开 时 所 设 定 的 访问 模式 。fGopen 返 回 一 个 新 的 
文件 流 ， 失 败 时 返回 NULL。 


3.7 文件 和 目录 的 维护 
标准 库 和 系统 调用 为 文件 和 目录 的 创建 与 维护 提供 了 全 面 的 支持 。 
3.7.1 chmo 系统 调用 


你 可 以 通过 chmod 系 统 调用 来 改变 文件 或 目录 的 访问 权限 。 这 构成 了 shell 程 序 chmoa 的 基础 。 
该 函数 原型 如 下 : 
Winclude «sys/stat.h» 


int chmod(const char *path, mode t mode); 

path 参 数 指定 的 文件 被 修改 为 具有 mode 参 数 给 出 的 访问 权限 。 参 数 mode 的 定义 与 open 系 统 调用 
中 的 一 样 ， 也 是 对 所 要 求 的 访问 权限 进行 按 位 OR 操作 。 除 非 程序 被 赋予 适当 的 特权 ， 否 则 只 有 文件 
的 属 主 或 超级 用 户 可 以 修改 它 的 权限 。 
3.7.2 chown 系统 调用 

超级 用 户 可 以 使 用 chown 系 统 调用 来 改变 一 个 文件 的 属 主 。 


#include <sys/types.h> 
#include <unistd.h> 
int chown(const char *path, uid t owner, gid t group); 
这 个 调用 使 用 的 是 用 户 ID 和 组 ID 的 数字 值 ( 通 过 getuia 和 getgia 调 用 获得 ) 和 一 个 用 于 限定 谁 
可 以 修改 文件 属 主 的 系统 值 。 如 果 已 经 设置 了 适当 的 特权 ， 文 件 的 属 主 和 所 属 组 就 会 改变 。 
POSIX 规 范 实际 上 允许 非 超级 用 户 改 变 文件 的 属 主 。 虽 然 所 有 “正确 的 ”POSIX 系 统 都 
不 允许 这 样 做 ， 但 严格 来 说 ， 这 是 它 的 一 个 扩展 规定 (FIPS 151-2 ) 里 要 求 的 。 我 们 在 本 书 
里 讨论 的 系统 都 遵守 XSI( X/Open System Interface，X/Open 系 统 接口 ) 规 范 ， 并 且 执 行文 件 的 
所 有 权 规 则 。 


3.7.3 unlink, link 和 symlink 系统 调用 


你 可 以 使 用 unlink 系 统 调 用 来 删除 一 个 文件 。 
unlink 系 统 调 用 删除 一 个 文件 的 目录 项 并 减少 它 的 链接 数 。 它 在 成 功 时 返回 0， 失 败 时 返回 -1。 
如 果 想 通过 调用 这 个 函数 来 成 功 删除 文件 ， 你 就 必须 拥有 该 文件 所 属 目录 的 写 和 执行 权限 。 
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#include <unistd.h> 


int unlink(const char *path); 
int link(const char *pathl, const char *path2); 
int symlink(const char *pathi, const char *path2); 


AUR — A X ERARO, HERRERNE, RARR. kE, HRI 
总 是 被 立刻 删除 ， 但 文件 所 占用 的 空间 要 等 到 最 后 一 个 进程 (如果 有 的 话 ) 关闭 它 之 后 才 会 被 系统 回 
收 。rm 程 序 使 用 的 就 是 这 个 调用 。 文 件 上 其 他 的 链接 表示 这 个 文件 还 有 其 他 名 字 ， 这 通常 是 由 ln 程序 
创建 的 。 你 可 以 使 用 linx 系 统 调用 在 程序 中 创建 一 个 文件 的 新 链接 。 

先 用 open 创 建 一 个 文件 ， 然 后 对 其 调用 unlink 是 某 些 程序 员 用 来 创建 临时 文件 的 技巧 。 

这 些 文件 只 有 在 被 打开 的 时 候 才能 被 程序 使 用 ， 当 程序 退出 并 且 文 件 关闭 的 时 候 它们 就 会 被 

自动 删除 掉 。 

link 系 统 调用 将 创建 一 个 指向 已 有 文件 pathi 的 新 链接 。 新 目录 项 由 path2 给 出 。 你 可 以 通过 
symlink 系 统 调用 以 类 似 的 方式 创建 符号 链接 。 注 意 ， 一 个 文件 的 符号 链接 并 不 会 增加 该 文件 的 链接 
数 ， 所 以 它 不 会 像 普 通 〈 硬 ) 链接 那样 防止 文件 被 删除 。 


3.7.4 mkdir 和 rmdir 系统 调用 


你 可 以 使 用 mkair 和 rmair 系 统 调用 来 建立 和 删除 目录 。 

#include «sys/types.h» 

#include «sys/stat.h» 

int mkdir(const char *path, mode t mode); 

mkdir 系 统 调用 用 于 创建 目录 , 它 相当 于 mkair 程 序 .mkdair 调 用 将 参数 path 作 为 新 建 目 录 的 名 字 。 
目录 的 权限 由 参数 mode 设 定 ， 其 含义 将 按 open 系 统 调用 的 o_cREAT 选 项 中 的 有 关 定 义 设置 。 当 然 ， 它 
还 要 服从 umask 的 设置 情况 。 

#include <unistd.h> 

int rmdir(const char *path); 

rmdir 系 统 调用 用 于 删除 目录 ， 但 只 有 在 目录 为 空 时 才 行 。rmair 程 序 就 是 用 这 个 系统 调用 来 完 
成 工作 的 。 
3.7.5 chdir 系统 调用 和 getcwa 函数 


程序 可 以 像 用 户 在 文件 系统 里 那样 来 浏览 目录 。 就 像 你 在 shell 里 使 用 ca 命令 来 切换 目录 一 样 ， 程 
序 使 用 的 是 chair 系 统 调用 。 

#include <unistd.h> 

int chdir(const char *path); 

程序 可 以 通过 调用 getcwG 函 数 来 确定 自己 的 当前 工作 目录 。 

#include <unistd.h> 

Char *getcwd(char *buf, size t size); 

getcwd 函 数 把 当前 目录 的 名 字 写 到 给 定 的 缓冲 区 buf 里 。 如 果 目 录 名 的 长 度 超出 了 参数 si ze 给 出 
的 缓冲 区 长 度 〈 一 个 ERANGE 错 误 )， 它 就 返回 NULL。 如 果 成 功 ， 它 返回 指针 buf。 
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如 果 在 程序 运行 过 程 中 , 目录 被 删除 ( EINVAL 错 误 ) 或 者 有 关 权 限 发 生 了 变化 ( EACCESS 
错误 )，getcwd 也 可 能 会 返回 NULL。 


3.8 扫描 目录 


Linux 系 统 上 一 个 常见 问题 就 是 扫描 目录 ,也 就 是 确定 一 个 特定 目录 下 存放 的 文件 。 在 shell 程 序 设 
计 中 ， 这 很 容易 做 到 一 一 只 需 让 shell 做 一 次 表达 式 的 通配符 扩展 。 在 过 去 ，UNIX 操 作 系统 的 各 种 变 
体 都 允许 用 户 通过 编程 访问 底层 文件 系统 结构 。 你 仍然 可 以 把 目录 当 作 一 个 普通 文件 那样 打开 ， 并 直 
接 读 取 目 录 数据 项 ， 但 不 同 的 文件 系统 结构 及 其 实现 已 经 使 这 种 方法 没什么 可 移植 性 了 。 现 在 ， 一 整 
套 标准 的 库 函数 已 经 被 开发 出 来 ， 使 得 目录 的 扫描 工作 变 得 简单 多 了 。 

与 目录 操作 有 关 的 函数 在 ai rent .h 头 文件 中 声明 。 它 们 使 用 一 个 名 为 DIR 的 结构 作为 目录 操作 的 
基础 。 被 称 为 目录 流 的 指向 这 个 结构 的 指针 DIR O 被 用 来 完成 各 种 目录 操作 ， 其 使 用 方法 与 用 来 
操作 普通 文件 的 文件 流 FILE *) 非常 相似 。 目 录 数 据 项 本 身 则 在 airent 结 构 中 返回 ， 该 结构 也 是 
在 Girent .h 头 文件 里 声明 的 ， 这 是 因为 用 户 不 应 直接 改动 DIR 结 构 中 的 数据 字段 。 

我 们 将 介绍 下 面 这 儿 个 函数 : 

U opendir. closedir 

O readdir 

O telldir 

Q seekdir 

U closedir 


3.8.1 opendir 函数 

opendir 函 数 的 作用 是 打开 一 个 目录 并 建立 一 个 目录 流 。 如 果 成 功 ， 它 返回 一 个 指向 DIR 结 构 的 
指针 ， 该 指针 用 于 读 取 目 录 数 据 项 。 

Winclude <sys/types.h> 

#include «dirent.h» 

DIR *opendir(const char *name); 

openair 在 失败 时 返回 一 个 空 指针 。 注 意 ， 目 录 流 使 用 一 个 底层 文件 描述 符 来 访问 目录 本 身 ， 所 
以 如 果 打开 的 文件 过 多 ，openair 可 能 会 失败 。 


3.8.2 readdir 函数 


reaqdir 函 数 返 回 一 个 指针 ， 该 指针 指向 的 结构 里 保存 着 目录 流 airp 中 下 一 个 目录 项 的 有 关 资 
料 。 后 续 的 readdiz 调 用 将 返回 后 续 的 目录 项 。 如 果 发 生 错 误 或 者 到 达 目 录 尾 ，readair 将 返回 NULL。 
POSIX 兼 容 的 系统 在 到 达 目 录 尾 时 会 返回 NULL， 但 并 不 改变 errno 的 值 ， 只 有 在 发 生 错 误 时 才 会 设置 
errno. 

#include <sys/types.h> 

#include «dirent.h» 

struct dirent *readdir(DIR *dirp); 

注意 ， 如 果 在 readair 函 数 扫描 目录 的 同时 还 有 其 他 进程 在 该 目录 里 创建 或 删除 文件 ，reaaair 
将 不 保证 能 够 列 出 该 目录 里 的 所 有 文件 (和子 目录 )。 
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airent 结 构 中 包含 的 目录 项 内 容 包括 以 下 部 分 。 

O ino t d ino: 文件 的 inode 节 点 号 。 

U char d name(]: 文件 的 名 字 。 

要 想 进一步 了 解 目录 中 某 个 文件 ， 你 需要 使 用 在 本 章 前 面 介绍 过 的 scat 调 用 。 


3.83 telldir 函数 


telldir 函 数 的 返回 值 记 录 着 一 个 目录 流 里 的 当前 位 置 。 你 可 以 在 随后 的 seekair 调 用 中 利用 这 
个 值 来 重 置 目录 扫描 到 当前 位 置 。 

#include <sys/types.h> 

#include «dirent.h» 

long int telldir(DIR *dirp); 


3.84 seekdir 函数 


seekdir 函 数 的 作用 是 设置 目录 流 airp 的 目录 项 指针 。1oc 的 值 用 来 设置 指针 位 置 ， 它 应 该 通过 
前 一 个 tellair 调 用 获得 。 

#include <sys/types.h> 

#include «dirent.h» 

void seekdir(DIR *dirp, long int loc); 


3.8.5 closedir 函数 

closedir 函 数 关闭 一 个 目录 流 并 释放 与 之 关联 的 资源 。 它 在 执行 成 功 时 返 同 0， 发 生 错 误 时 返回 
-1。 

#include <sys/types.h> 

#include «dirent.h» 

int closedir(DIR *dirp); 

在 下 面 的 printair.c 程 序 中 ， 你 将 把 许多 文件 处 理 函数 集中 在 一 起 以 实现 一 个 简单 的 目录 列表 
功能 。 目 录 中 的 每 个 文件 单独 列 在 一 行 上 。 每 个 子 目 录 会 在 它 的 名 字 后 面 加 上 一 个 仙 线 字符 /， 子 目 
录 中 的 文件 在 缩 进 四 个 空格 后 依次 排列 。 

程序 会 逐个 切换 到 每 个 下 级 子 目录 里 ， 这 样 使 它 找 到 的 文件 都 有 一 个 可 用 的 名 字 。 也 就 是 说 ， 它 
们 都 可 以 被 直接 传递 给 cpendir 函 数 。 如 果 目 录 的 媒 套 层次 太 深 ， 程 序 执行 就 会 失败 ， 这 是 因为 对 允 
许 打开 的 目录 流 数目 是 有 限制 的 。 

我 们 当然 可 以 采取 一 个 更 通用 的 做 法 ， 让 程序 能 够 通过 一 个 命令 行 参 数 来 指定 起 点 〈 从 哪个 目录 
开始 )。 请 查阅 有 关 工 具 程序 (如 1s 和 finda) 的 Linux 源 代码 来 找到 实现 更 通用 程序 的 方法 。 


*w 一 个 目录 扫描 程序 


(1) 程序 的 开始 是 一 些 必要 的 头 文件 。 接 下 来 是 printdir 函 数 ， 它 的 作用 是 输出 当前 目录 的 内 容 。 
它 将 递归 遍历 各 级 子 目 录 ， 使 用 aepth 参 数 来 控制 缩 排 。 


#include <unistd.h> 
#include <stdio.h> 
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#include <dirent.h> 
#include <string.h> 
#include <sys/stat.h> 
#include «stdlib.h» 


Void printdir (char *dir, int depth) 
{ 


DIR *dp; 
struct dirent *entry; 
struct stat statbuf; 


if((dp = opendir(dir)) == NULL) ( 
fprintf (stderr, "cannot open directory: $sWn*, dir); 
return; 
} 
chdir (dir); 
while((entry = readdir(dp)) != NULL) ( 
lstat(entry-»d name,&statbuf); 
if(S ISDIR(statbuf.st mode)) ( 
/* Found a directory, but ignore . and .. */ 
if(stremp(*.",entry-»d name) == 0 || 
strcmp(*..",entry-»d name) == 0) 
continue; 
printf(*$*sts/n* , depth, "", entry-»d name); 
/* Recurse at a new indent level */ 
printdir(entry-»d name,depthe4); 








} 
else printf(*$*sis n" , depth,"",entry->d_name); 





) 

chdir(*..*); 

closedir (dp); 
) 


(2) 下 面 是 main 函 数 : 


int main() 

( 
printf ("Directory scan of /home:\n"); 
printdir("/home*,0); 
printf (*done. W*) ; 


exit(0); 
} 


这 个 程序 扫描 home 目 录 并 产生 如 下 所 示 的 输出 (经 过 简化 )。 如 果 想 扫描 其 他 用 户 的 目录 ， 你 可 


能 需要 超级 用 户 的 权限 。 

$ ./printdir 

Directory scan of /home: 

neil/ 
Xdefaults 
-Xmodmap 
-Xresources 
.bash history 
.bashrc 
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-kde/ 
share/ 
apps/ 
konqueror/ 
dirtree/ 
public html.desktop 
toolbar/ 
bookmarks .xml 
kong history 
kdisplay/ 
color-schemes/ 
BLP4e/ 
Gnu Public License 
chapter04/ 
argopt.c 
args.c 
chapter03/ 
file.out 
mmap.c 
printdir 
done. 


绝 大 部 分 操作 都 是 在 printair 函 数 里 完成 的 。 在 用 openGir 函 数 检查 完 指定 目录 是 否 存在 后 
printdir 调 用 chair 进 入 指定 目录 。 如 果 readair 函 数 返回 的 数据 项 不 为 空 ， 程 序 就 检查 该 数据 项 是 
否 是 一 个 目录 。 如 果 不 是 ， 程 序 就 根据 Gepth 的 值 缩 进 打印 该 文件 数据 项 的 内 容 。 

如 果 该 数据 项 是 一 个 目录 ， 你 就 需要 对 它 进行 递归 遍历 。 在 跳 过 .和 . .数据 项 (它们 分 别 代表 当 
前 目录 和 上 一 级 目录 ) 后 ，printadiz 函 数 调用 自己 并 再 次 进入 一 个 同样 的 处 理 过 程 。 那 它 又 是 如 何 退 
出 这 些 循环 的 呢 ? 一 旦 while 循 环 完成 ,chair(".…") 调 用 将 把 它 带 回 到 目录 树 的 上 一 级 ， 从 而 可 以 继 
续 进行 上 级 目录 的 遍历 。 调 用 closedir (dp) 关闭 目录 是 为 了 确保 打开 的 目录 流 数目 不 超出 其 需要 。 

作为 对 第 4 章 所 介绍 的 Linux 环 境 的 一 个 简短 尝试 ， 让 我 们 来 看 一 个 能 够 使 这 个 程序 更 具 通 用 性 的 
方法 。 这 个 程序 的 功能 受 限 是 因为 它 只 能 对 目录 /home 进 行 操作 。 如 果 我 们 按 下 面 的 方法 对 main 函 数 
进行 修改 ， 就 能 把 它 变 成 一 个 更 有 用 的 目录 浏览 器 

int main(int argc, char* argv[]) 

t 





char *topdir = *.'; 
if (argc >= 2) 
topdirzargv[1]; 
printf(*Directory scan of $sWn",topdir); 
printdir(topdir,0); 
printf(*done.Wn*); 


exit(0); 


) 

我 们 修改 了 3 条 语句 ， 增 加 了 5 条 语句 ， 它 现在 是 一 个 通用 的 工具 程序 了 。 它 多 了 一 个 可 选 的 目录 
名 参数 ， 其 默认 值 是 当前 目录 。 你 可 以 通过 下 面 的 命令 运行 它 

$ ./printdir2 /usr/local | more 
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输出 结果 将 分 页 显示 ， 用 户 可 以 通过 翻 页 查看 其 输出 。 可 以 说 ， 用 户 现在 有 了 一 个 非常 方便 、 通 
用 的 目录 树 浏览 器 。 你 不 必 花 费 过 多 精力 就 可 以 为 这 个 程序 再 增加 空间 占用 统计 、 遍 历 深度 限制 等 其 
他 功能 。 








3.9 ”错误 处 理 


正如 你 已 经 看 到 的 ， 本 章 介 绍 的 许多 系统 调用 和 函数 都 会 因为 各 种 各 样 的 原因 而 失败 。 它 们 会 在 
失败 时 设置 外 部 变量 errno 的 值 来 指明 失败 的 原因 。 许 多 不 同 的 函数 库 都 把 这 个 变量 用 做 报告 错误 的 
标准 方法 。 值 得 重申 的 是 ， 程 序 必须 在 函数 报告 出 错 之 后 立刻 检查 errno 变 量 ， 因 为 它 可 能 被 下 一 个 
函数 调用 所 覆盖 ， 即 使 下 一 个 函数 自身 并 没有 出 错 ， 也 可 能 会 覆盖 这 个 变量 。 

错误 代码 的 取 值 和 含义 都 列 在 头 文件 errno.h 里 ， 如 下 所 示 。 

口 EPERM: 操作 不 允许 。 

口 ENOENT: 文件 或 目录 不 存在 。 

O EINTR: 系统 调用 被 中 断 。 

O gro: VORR. 

口 BBusY: 设备 或 资源 忙 。 

O EEXIST: 文件 存在 。 

口 EINVAL: 无 效 参数 。 

口 EMFILE: 打开 的 文件 过 多 。 

口 ENODEV: 设备 不 存在 

口 ETSDIR: 是 一 个 目录 。 

O ENOTDIR: 不 是 一 个 目录 。 

有 两 个 非常 有 用 的 函数 可 以 用 来 报告 出 现 的 错误 ， 它 们 是 strerror 和 perror。 


3.9.1 strerror 函数 

strerror 函 数 把 错误 代码 映射 为 一 个 字符 串 ， 该 字符 串 对 发 生 的 错误 类 型 进行 说 明 。 这 在 记录 错 
误 条 件 时 十 分 有 用 。 

该 函数 原型 如 下 : 


#include <string.h> 





char *strerror(int errnum); 


3.9.2 perror 函数 

perror 函 数 也 把 errno 变 量 中 报告 的 当前 错误 映射 到 一 个 字符 串 ， 并 把 它 输 出 到 标准 错误 输出 
该 字符 串 的 前 面 先 加 上 字符 串 s〈 如 果 不 为 空 ) 中 给 出 的 信息 ， 青 加 上 一 个 冒号 和 一 个 空格 。 

该 函数 原型 如 下 : 


#include «stdio.h» 





void perror(const char *s); 
请 看 下 面 的 例子 : 


perror ("program") ; 
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它 可 能 在 标准 错误 输出 中 给 出 如 下 的 输出 结果 : 
program: Too many open files 
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我 们 在 前 面 提 到 过 ，Linux 将 一 切 事物 都 看 作为 文件 ， 硬 件 设备 在 文件 系统 中 也 有 相应 的 条 目 。 
我 们 使 用 底层 系统 调用 这 样 一 种 特殊 方式 通过 /dev 目录 中 的 文件 来 访问 硬件 。 

控制 硬件 的 软件 驱动 程序 通常 可 以 以 某 种 特定 方式 配置 ， 或 者 能 够 报告 相关 信息 。 例 如 ， 一 个 硬 
盘 控制 程序 可 以 被 配置 为 使 用 一 个 特殊 的 DMA 模 式 。 一 块 网 卡 可 以 报告 它 是 否 协商 了 一 个 高 速 、 双 
工 的 连接 。 

用 于 与 设备 驱动 程序 进行 通信 的 工具 在 过 去 就 已 经 十 分 常见 。 例如，haparm 可 以 用 来 配置 一 些 磁 
盘 参 数 ,ifconfig 可 以 报告 网 络 统计 信息 。 近年 来 , 倾向 于 提供 更 一 致 的 方式 来 访问 驱动 程序 的 信息 。 
事实 上 ， 这 种 一 致 的 方式 甚至 延伸 到 包括 与 Linux 内 核 的 各 种 元 素 的 通信 。 

Linux 提 供 了 一 个 特殊 的 文件 系统 procfs, 它 通常 以 /proc 目 录 的 形式 呈现 。 该 目录 中 包含 了 许多 
特殊 文件 用 来 对 驱动 程序 和 内 核 信 息 进行 更 高 层 的 访问 。 只 要 应 用 程序 有 正确 的 访问 权限 ， 它 们 就 可 
以 通过 读 写 这 些 文件 来 获得 信息 或 设置 参数 。 

/proc 目 录 中 的 文件 会 随 系统 的 不 同 而 不 同 , 当 Linux 版 本 中 有 更 多 的 驱动 程序 和 设施 支持 procfs 
文件 系统 时 ， 该 目录 中 就 会 包含 更 多 的 文件 。 在 这 里 ， 我 们 将 介绍 一 些 /proc 目 录 中 常用 的 文件 ， 并 
简单 讨论 它们 的 用 途 。 

用 来 撰写 本 章 内 容 的 电脑 上 的 /proc 目 录 列 表 包括 如 下 项 目 ， 


i 10514/ 20254/ 6/ 9057/ 9623/ ide/ mtrr 
10359/ 10524/ 29/ 698/  9089/ 9638/ interrupts net/ 
10360/ 10530/ 2983/  699/  9118/ acpi/ iomem partitions 
10381/ 10539/ 3/ 710/  9119/ asound/ ioports scsi/ 
10438/ 10541/ 30/ 711/  9120/ buddyinfo ^ irq/ selfa 
10441/ 10555/ 3069/  742/  9138/ bus/ kallsyms slabinfo 
10442/ 10688/ 3098/  7808/ 9151/ cmdline kcore splash 
10478/ 10689/ 3099/  7813/ 92/  config.gz keys stat 
10479/ 10784/ 31/ 8357/ 9288/ cpuinfo key-users swaps 
10482/ 113/  3170/  8371/ 93/ crypto kmsg sys/ 
10484/ 115/ 3171/  840/  9355/ devices loadavg sysrq-trigger 
10486/ 116/ 3177/  8505/ 9407/ diskstats locks sysvipc/ 
10495/ 1167/  32288/ 8543/ 9457/ dma mástat tty/ 
10497/ 1168/  3241/  8547/ 9479/ driver/ meminfo uptime 
10498/ 1791/  352/ 8561/ 9618/ execdomains misc version 
10500/ 19557/ 4/ 8677/ 9619/ fb modules vmstat 
10502/ 19564/ 4010/  888/  9621/ filesystems mountse zoneinfo 
10510/ 2/ 5/ 8910/ 9622/ fs/ mpt/ 
在 多 数 情况 下 ， 只 需 直 接 读 取 这 些 文件 就 可 以 获得 状态 信息 。 例 如 ，/proc/cpuinfo 给 出 的 是 cpu 
的 详细 信息 : 
$ cat /proc/cpuinfo 
processor :0 
vendor id : GenuineIntel 
cpu family : 15 
model : 2 


model name : Intel(R) Pentium(R) 4 CPU 2.66GHz 
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stepping :8 
cpu MHz : 2665.923 

cache size : 512 KB 

fdiv bug :no 

hlt_bug : no 

£00f_bug : no 

coma_bug : no 

fpu : yes 

fpu exception : yes 

cpuid level :2 

wp : yes 

flags : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat 
pse36 clflush dts acpi mmx fxsr sse sse2 ss up 

bogomips : 5413.47 

clflush size — : 64 


类 似 地 ，/proc/meminfo 和 /proc/version 分 别 给 出 的 是 内 存 使 用 情况 和 内 核 版 本 信息 : 
$ cat /proc/meminfo 











MemTotal: 776156 kB 
MemFree: 28528 kB 
Buffers: 191764 kB 
Cached: 369520 kB 
SwapCached: 20 kB 
Active: 406912 kB 
Inactive: 274320 kB 
HighTotal: 0 kB 
HighFree: 0 kB 
LowTotal: 776156 kB 
LowFree: 28528 kB 
SwapTota: 1164672 kB 
SwapFree: 1164652 kB 
Dirty: 68 kB 
Writeback: 0 kB 
AnonPages: 95348 kB 
Mapped: 49044 kB 
Slab: 57848 kB 
SReclaimable: 48008 kB 
SUnreclaim: 9840 kB 
PageTables: 1500 kB 
NFS Unstable: 0 kB 
Bounce: 0 kB 
CommitLimit: 1552748 kB 
Committed AS: 189680 kB 


VmallocTotal: 245752 kB 


VmallocUsed: 10572 kB 
VmallocChunk: 234556 kB 
HugePages Total: 0 
HugePages Free: 0 
HugePages Rsvd: 0 
Hugepagesize: 4096 kB 


$ cat /proc/version 
Linux version 2.6.20.2-2-default (geeko8buildhost) (gcc version 4.1.3 20070218 
(prerelease) (SUSE Linux)) $1 SMP Fri Mar 9 21:54:10 UTC 2007 


每 次 读 取 这 些 文件 的 内 容 时 ， 它 们 所 提供 的 信息 都 会 及 时 更 新 。 所 以 再 读 一 次 meminfo 文 件 会 给 
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出 最 新 的 信息 。 
你 可 以 通过 特定 内 核 函 数 获得 更 多 的 信息 ， 它 们 位 于 /proc 目 录 的 子 目 录 中 。 例 如 ， 你 可 以 通过 
/proc/net/sockstat 文 件 获得 网 络 套 接 字 的 使 用 统计 : 


$ cat /proc/net/sockstat 

Sockets: used 285 

TCP: inuse 4 orphan 0 tw 0 alloc 7 mem 1 
UDP: inuse 3 

UDPLITE: inuse 0 

RAW: inuse 0 

FRAG: inuse 0 memory 0 


/proc 目 录 中 的 有 些 条 目 不 仅 可 以 被 读 取 ， 而 且 可 以 被 修改 。 例 如 ， 系 统 中 所 有 运行 的 程序 同时 
能 打开 的 文件 总 数 是 Linux 内 核 的 一 个 参数 。 它 的 当前 值 可 通过 读 取 /proc/sys/fs/file-max 文 件 得 
到 : 


$ cat /proc/sys/fs/file-max 
76593 


这 个 值 被 设置 为 76 593。 如 果 你 需要 增 大 该 值 ， 则 可 以 通过 写 同一 个 文件 来 实现 。 如 果 你 正在 运 
行 一 个 需要 同时 打开 很 多 文件 的 应 用 程序 套件 〈 例 如 ， 一 个 使 用 了 很 多 表 的 数据 库 系统 ) ， 你 可 能 就 
需要 这 么 做 。 

对 /proc 目 录 中 的 文件 进行 写 操作 需要 超级 用 户 的 权限 . 你 在 修改 数据 时 需要 特别 小 心 ， 

写 入 不 适当 的 值 可 能 会 引发 严重 的 问题 , 比如 系统 崩溃 和 数据 丢失 - 

如 果 要 将 系统 范围 的 文件 句柄 限制 增加 为 80 000， 你 只 需 将 新 的 上 限 值 写 入 file-max 文 件 即 可 : 

# echo 80000 »/proc/sys/fs/file-max 

现在 ， 当 你 再 次 读 取 该 文件 时 ， 你 就 可 以 看 到 新 设 定 的 值 : 

$ cat /proc/sys/fs/file-max 

80000 

/proc 目 录 中 以 数字 命名 的 子 目录 用 于 提供 正 : 
何以 进程 的 方式 执行 。 

现在 ， 你 只 需要 知道 每 个 进程 都 有 一 个 唯一 的 标识 符 : 一 个 在 1 一 32 000 的 数字 。ps 命 令 会 给 出 当 
前 正在 运行 进程 的 列表 。 例如， 在 本 章 正在 编写 的 时 候 : 

neilésusel03:-/BLPde/chapter03» ps -a 

PID TTY TIME CMD 


9118 pts/1 00:00:00 ftp 
9230 pts/1 00 0 ps 


运行 的 程序 的 信息 。 你 将 在 第 11 章 中 学 习 程 序 如 








10689 pts/1 00:00:01 bash 

neil@susel03:~/BLP4e/chapter03> 

你 可 以 看 到 有 几 个 正在 运行 bash shell 的 终端 会 话 和 一 个 正在 运行 ftp 程 序 的 文件 传输 会 话 。 你 可 
以 通过 查看 /proc 目 录 来 获得 更 多 关于 ftp 会 话 的 细节 。 

ftp 的 进程 标识 符 是 9118， 所 以 你 需要 查看 /proc/9118 来 获得 关于 它 的 更 多 细节 : 


$ 1s -1 /proc/9118 
total 0 


x 2 neil users 0 2007-05-20 07:43 attr 
- 1 neil users 0 2007-05-20 07:43 auxv 
- 1 neil users 0 2007-05-20 07:35 cmdline 











2007-05-20 07:43 cpuset 
2007-05-20 07:43 cwd -» /home/neil/BLP4e/chapter03 
2007-05-20 07:43 environ 

2007-05-20 07:43 exe -» /usr/bin/pftp 

2007-05-20 07:19 fd 

2007-05-20 07:43 loginuid 

2007-05-20 07:43 maps 






users 0 2007-05-20 07:43 mem 
users 0 2007-05-20 07:43 mounts 
users 0 2007-05-20 07:43 oom adj 
users 0 2007-05-20 07:43 oom score 
users 0 2007-05-20 07:43 root -> / 
users 0 2007-05-20 07:43 seccomp 
users 0 2007-05-20 07:43 smaps 
users 0 2007-05-20 07:33 stat 


users 0 2007-05-20 07:43 statm 


users 0 2007-05-20 07:33 status 
users 0 2007-05-20 07:43 task 
users 0 2007-05-20 07:43 wchan 


你 可 以 看 到 各 种 特殊 文件 。 它们 可 以 告诉 你 该 进程 的 相关 信息 。 

从 上 面 的 输出 中 你 可 以 知道 程序 /usr/bin/pftp 正 在 运行 ， 它 的 当前 工作 目录 是 /homeyneily 
BLP4e/chapter03。 通 过 查看 这 个 目录 下 的 其 他 文件 ， 你 还 可 以 看 到 启动 它 的 命令 行 以 及 它 的 shell 环 
境 。cmaline 和 environ 文 件 以 一 系列 nul1 终 止 的 字符 串 来 提供 这 些 信息 ， 所 以 你 在 查看 它们 时 需要 
小 心 。 我 们 将 在 第 4 章 对 Linux 环 境 进行 深入 讨论 。 


$ od -c /proc/9118/cmdline 


0 
0 
0 
0 
0 
0 
0 
o 
0 
users 0 2007-05-20 07:43 mountstats 
0 
0 
0 
0 
0 
0 
0 
0 
0 





0000000 f 't 和 
0000020 ^0 
0000021 


你 可 以 看 到 ftp 是 由 命令 行 ftcp 192.168.0.12 启 动 的 。 

fd 子 目录 提供 该 进程 正在 使 用 的 打开 的 文件 描述 符 的 信息 。 这 个 信息 在 确定 一 个 程序 同时 打开 了 
多 少 文件 时 十 分 有 用 。 每 个 打开 的 描述 符 都 有 对 应 的 一 个 条 目 ， 条 目 名 字 与 描述 符 的 数字 相 匹 配 。 在 
本 例 中 ， 你 可 以 看 到 ftp 如 我 们 所 预期 的 那样 打开 了 0、1、2 和 3 描述 符 。 它 们 分 别 是 标准 输入 、 标 准 
输出 和 标准 错误 描述 符 以 及 一 个 到 远程 服务 器 的 连接 。 

$ 1s /proc/9118/fd 

0123 


3.11 高 级 主题 : fcnt1 和 mmap 


本 节 我 们 将 讨论 的 主题 你 可 能 会 想 跳 过 ， 因 为 它们 很 少 会 被 用 到 。 话 虽 如 此 ， 但 我 们 还 是 把 它 放 
在 这 里 供 你 参考 ， 因 为 在 解决 一 些 韩 手 问题 时 ， 它 们 可 以 提供 比较 简单 的 解决 方案 。 


3.11.1 fcntl 系统 调用 


fcnt1 系 统 调用 对 底层 文件 描述 符 提供 了 更 多 的 操纵 方法 。 
#include «fentl.h» 





int fcntl(int fildes, int cmd); 
int fcntl(int fildes, int cmd, long arg); 
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利用 fcnt1 系 统 调用 ， 你 可 以 对 打开 的 文件 描述 符 执行 各 种 操作 ， 包 括 对 它们 进行 复制 、 获 取 和 
设置 文件 描述 符 标 志 、 获 取 和 设置 文件 状态 标志 ， 以 及 管理 建议 性 文件 锁 等 。 
对 不 同 操作 的 选择 是 通过 选取 命令 参数 cm 不 同 的 值 来 实现 的 ， 其 取 值 定义 在 头 文件 fcnt1.h 中 。 
根据 所 选择 命令 的 不 同 ， 系 统 调用 可 能 还 需要 第 三 个 参数 arg。 
O fentl(fildes, F DUPFD, newfd): 这 个 调用 返回 一 个 新 的 文件 描述 符 ， 其 数值 等 于 或 大 于 
整数 newfG。 新 文件 描述 符 是 描述 符 fildes 的 一 个 副本 。 根 据 已 打开 文件 数目 和 newfa 值 的 情 
况 ， 它 的 效果 可 能 和 系统 调用 dup (fildes) 完 全 一 样 。 
口 fcnti(fildes, F GETFD): 这 个 调用 返回 在 fcnt1.h 头 文件 里 定义 的 文件 描述 符 标 志 ， 其 中 
包括 FD_cLOEXEC， 它 的 作用 是 决定 是 否 在 成 功 调用 了 某 个 exec 系 列 的 系统 调用 之 后 关闭 该 文 
件 描述 符 。 
口 fcntl(fildes，F_SETFD，flags): 这 个 调用 用 于 设置 文件 描述 符 标 志 ， 通 常 仅 用 来 设置 
FD_CLOEXEC。 
口 fcntl(fildes，F_GETFL) 和 fcncl(fildes，F_SETFL，flags): 这 两 个 调用 分 别 用 来 获取 
和 设置 文件 状态 标志 和 访问 模式 。 你 可 以 利用 在 Ecnt1.h 头 文件 中 定义 的 掩 码 9_ AccMoDE 来 提 
取出 文件 的 访问 模式 。 其 他 标志 包括 那些 当 open 调 用 使 用 0_cREAT 打 开 文件 时 作为 第 三 参数 出 
现 的 标志 。 注 意 ， 你 不 能 设置 所 有 的 标志 ， 特 别 是 不 能 通过 fcnt1 设 置 文件 的 权限 
你 还 可 以 通过 fcnt1 实 现 建议 性 文件 锁 。 详 细 信 息 请 参考 fcnt1 手 册页 的 第 二 节 ， 或 者 阅读 本 书 
的 第 7 章 ， 我 们 将 在 那里 讨论 文件 锁 。 
3.11.2 mmap 函数 
UNIX 提 供 了 一 个 有 用 的 功能 以 允许 程序 共享 内 存 , Linux 内 核 从 2.0 版 本 开始 已 经 把 这 一 功能 包括 
HEK. mmap (内 存 映射 》 函数 的 作用 是 建立 一 段 可 以 被 两 个 或 更 多 个 程序 读 写 的 内 存 。 一 个 程序 对 它 
所 做 出 的 修改 可 以 被 其 他 程序 看 见 。 
这 一 功能 还 可 以 用 在 文件 的 处 理 上 。 你 可 以 使 某 个 磁盘 文件 的 全 部 内 容 看 起 来 就 像 是 内 存 中 的 一 
个 数组 。 如 果 文 件 由 记录 组 成 ， 而 这 些 记 录 又 能 够 用 C 语 言 中 的 结构 来 描述 的 话 ， 你 就 可 以 通过 访问 
结构 数组 来 更 新 文件 的 内 容 了 。 
这 要 通过 使 用 带 特殊 权限 集 的 虚拟 内 存 段 来 实现 。 对 这 类 虚拟 内 存 段 的 读 写 会 使 操作 系统 去 读 写 
磁盘 文件 中 与 之 对 应 的 部 分 。 
mmap 函 数 创建 一 个 指向 一 段 内 存 区 域 的 指针 , 该 内 存 区 域 与 可 以 通过 一 个 打开 的 文件 描述 符 访问 
的 文件 的 内 容 相关 联 。 


#include «sys/mman.h» 














void *mmap(void *addr, size t len, int prot, int flags, int fildes, off t off); 

你 可 以 通过 传递 off 参 数 来 改变 经 共享 内 存 段 访问 的 文件 中 数据 的 起 始 偏 移 值 。 打 开 的 文件 描述 
符 由 fildes 参 数 给 出 。 可 以 访问 的 数据 量 〈 即 内 存 段 的 长 度 ) 由 len 参 数 设 置 。 

你 可 以 通过 adar 参 数 来 请 求 使 用 某 个 特定 的 内 存 地 址 。 如果 它 的 取 值 是 零 ， 结 果 指针 就 将 自动 分 
配 。 这 是 推荐 的 做 法 ， 否 则 会 降低 程序 的 可 移植 性 ， 因 为 不 同系 统 上 的 可 用 地 址 范围 是 不 一 样 的 。 

prot 参 数 用 于 设置 内 存 段 的 访问 权限 。 它 是 下 列 常数 值 的 按 位 OR 结果 。 

口 PROT_READ: 允许 读 该 内 存 段 。 

O PROT_WRITE: 允许 写 该 内 存 段 。 

O PROT_EXEC: 允许 执行 该 内 存 段 。 
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口 PROT_NONE: 该 内 存 段 不 能 被 访问 。 
flags 参 数控 制程 序 对 该 内 存 段 的 改变 所 造成 的 影响 ， 可 以 使 用 的 选项 如 表 3-7 所 示 。 








表 3-7 
MAP. PRIVATE 内 存 段 是 私有 的 ， 对 它 的 修改 只 对 本 进程 有 效 
MAP SHARED 把 对 该 内 存 段 的 修改 保存 到 磁盘 文件 中 
MAP FIXED 该 内 存 段 必 须 位 于 adar 指 定 的 地 址 处 
msync 函 数 的 作用 是 : 把 在 该 内 存 段 的 某 个 部 分 或 整 段 中 的 修改 写 回 到 被 映射 的 文件 中 〈 或 者 从 


被 映射 文件 里 读 出 )。 

#include <sys/mman.h> 

int msync(void *addr, size t len, int flags); 

内 存 段 需要 修改 的 部 分 由 作为 参数 传递 过 来 的 起 始 地 址 aaar 和 长 度 len 确 定 。flags 参 数控 制 着 
执行 修改 的 具体 方式 ， 可 以 使 用 的 选项 如 表 3-8 所 示 。 





表 3-8 
MS_ASYNC 采用 异步 写 方式 
MS_SYNC 采用 同步 写 方式 
MS_INVALIDATE 从 文件 中 读 回 数据 


munmap 函 数 的 作用 是 释放 内 存 段 ， 


#include «sys/mman.h» 


int munmap(void *addr, size t len); 

下 面 的 程序 mmap.c 演 示 了 如 何 利用 mmap 和 数组 方式 的 存 取 操 作 来 修改 一 个 结构 化 数据 文件 。 注 
意 ，2.0 版 本 之 前 的 Linux 内 核 不 完全 支持 mmap 的 这 种 用 法 。 这 个 程序 在 Sun Solaris 和 其 他 操作 系统 上 
也 能 够 正确 运行 。 


实验 使 用 mmap 函 数 


(1) 我 们 先 定义 一 个 RECORD 数 据 结构 ， 然 后 创建 出 NRECoRDs 个 记录 ， 每 个 记录 中 保存 着 它们 各 自 
的 编号 。 然 后 把 这 些 记录 都 追加 到 文件 records .dat 里 去 。 


#include <unistd.h> 
#include <stdio.h> 
#include «sys/mman.h» 
#include «fcntl.h» 
#include <stdlib.h> 


typedef struct { 
int integer; 
char string[24]; 
} RECORD; 


#define NRECORDS (100) 


int main() 
{ 
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RECORD record, *mapped; 
int i, f; 
FILE *fp; 


fp = fopen(*records.dat*,"we*); 

for (i=0; i«NRECORDS; i++) ( 
record.integer - i; 
sprintf (record.string, RECORD-$d*,i); 
fwrite(&record,sizeof (record) ,1, fp); 





H 
fclose(fp); 
(2) 接着 ， 我 们 把 第 43 条 记录 中 的 整数 值 由 43 修 改 为 143， 并 把 它 写 入 第 43 条 记录 中 的 字符 串 。 


fp = fopen('records.dat*,'r«*); 
fseek(fp,43*sizeof(record),SEEK SET); 
fread (&record, sizeof (record) ,1, fp); 


record. integer = 143; 
sprintf (record. string, "RECORD-$d*,record.integer); 


fseek (fp, 43*sizeof (record) , SEEK_SET) ; 
fwrite (&record, sizeof (record) ,1, fp); 
fclose(fp); 


(3) 现在 把 这 些 记录 映射 到 内 存 中 ， 然 后 访问 第 43 条 记录 ， 把 它 的 整数 值 修改 为 243〈 同 时 更 新 该 
记录 中 的 字符 串 )， 使 用 的 还 是 内 存 映射 的 方法 。 
f = open("records.dat",O_RDWR) ; 


mapped = (RECORD *)mmap(0, NRECORDS*sizeof (record), 
PROT READ|PROT WRITE, MAP SHARED, f, 0); 


mapped[43].integer = 243; 
sprintf (mapped[43] . string, "RECORD-%d" , mapped [43] integer) ; 


msync((void *)mapped, NRECORDS*sizeof(record), MS ASYNC): 
munmap((void *)mapped, NRECORDS*sizeof (record) ); 
close(f); 


exit(0); 
) 


在 第 13 章 中 ， 你 将 学 习 另 外 一 种 共享 内 存 机 制 : System V 共 享 内 存 。 
3.42 小 结 


在 本 章 中 ， 你 学 习 了 Linux 提 供 的 直接 访问 文件 和 设备 的 方法 。 你 看 到 了 建立 在 这 些 底层 函数 之 
上 的 库 函 数 是 如 何 为 程序 设计 问题 提供 灵活 的 解决 方案 的 。 现 在 ， 你 已 经 能 够 只 用 很 少儿 行 代码 就 编 
写 出 功能 相当 强大 的 目录 扫描 例 程 了 。 

你 还 学 习 了 文件 和 目录 处 理 。 在 此 基础 之 上 ， 你 已 可 以 使 用 更 具 结构 化 的 、 基 于 文件 的 解决 方案 
将 在 第 2 章 最 后 编写 的 初级 的 CD 唱片 应 用 程序 转换 为 一 个 C 语 言 程序 了 。 但 目前 你 还 无 法 给 这 个 程序 
增加 新 的 功能 ， 所 以 对 整个 程序 的 重 写 工 作 将 推迟 到 你 学 习 了 如 何 处 理 屏幕 显示 和 键盘 输入 之 后 再 进 
行 ， 而 这 些 内 容 正 是 接 下 来 两 章 的 主题 。 


第 4 章 
Linux 环 境 


AL? 为 Linux (或 UNIX 和 类 UNIX 系 统 ) 编写 程序 时 ， 你 必须 考虑 到 程序 将 在 一 个 多 任务 环境 中 
运行 。 这 意味 着 在 同一 时 间 会 有 多 个 程序 运行 ， 它 们 共享 内 存 、 磁 盘 空 间 和 CPU 有 周期 等 机 
器 资源 。 甚 至 同一 程序 也 会 有 多 个 实例 同时 运行 。 最 重要 的 是 ， 这 些 程序 能 够 互 不 干扰 ， 能 够 了 解 它 
们 的 环境 ， 并 且 能 正确 运行 ， 不 产生 冲突 〈 例 如， 试图 与 其 他 程序 同时 写 同一 个 文件 )。 
在 本 章 中 ， 我 们 将 介绍 程序 运行 的 环境 ， 程 序 如 何 通过 环境 来 获得 有 关 其 运行 条 件 的 信息 ， 以 及 
用 户 怎样 改变 程序 的 行为 。 我 们 将 重点 介绍 以 下 内 容 : 
向 程序 传递 参数 
环境 变量 
查看 时 间 
临时 文件 
获得 有 关 用 户 和 主机 的 信息 
生成 和 配置 日 志 信 息 
了 解 系统 各 项 资源 的 限制 
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当 一 个 用 C 语 言 编写 的 Linux 或 UNIX 程 序 运行 时 , 它 是 从 main 函 数 开始 的 .对 这 些 程序 而 言 , main 
函数 的 声明 如 下 所 示 : 

int main(int argc, char *argv[]) 
其 中 argc 是 程序 参数 的 个 数 ，argv 是 一 个 代表 参数 自身 的 字符 串 数组 。 

你 可 能 也 会 看 到 Linux 的 C 程 序 将 main 函 数 简单 的 声明 为 

main() 

这 样 也 行 ， 因 为 默认 的 返回 值 类 型 是 int， 而 且 函 数 中 不 用 的 形式 参数 不 需要 声明 。argc 和 argv 
仍 在 ， 但 如 果 不 声 明 它们 ， 你 就 不 能 使 用 它们 。 

无 论 操作 系统 何 时 启动 一 个 新 程序 ， 参 数 arac 和 argv 都 被 设置 并 传递 给 main。 这 些 参数 通常 由 
另 一 个 程序 提供 ， 这 个 程序 一 般 是 shell， 它 要 求 操作 系统 启动 该 新 程序 。shell 接 受用 户 输入 的 命令 行 ， 
将 命令 行 分 解 成 单词 ,然后 把 这 些 单词 放 入 argv 数 组 。 请 记 住 : Linux 的 shell 一 般 会 在 设置 argc 和 argv 
之 前 对 文件 名 参数 进行 通配符 扩展 ， 而 MS-DOS 的 shell 则 期 望 程序 接受 带 通配符 的 参数 ， 并 执行 它们 
自己 的 通配符 扩展 。 

例如 ， 如 果 我 们 给 shell 输 入 如 下 命令 : 








DOOODOUO 
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$ myprog left right 'and center' 


程序 myprog 将 从 main 函 数 开始 ，main 带 的 参数 是 : 

argc: 4 

AA ("myprog", "left*, "right", "and center") 

注意 ， 参 数 个 数 包括 程序 名 自身 ，argv 数 组 也 包含 程序 名 并 将 它 作为 第 一 个 元 素 argv[0] 。 因 为 
我 们 在 shell 命 令 里 使 用 了 引号 ， 所 以 第 四 个 参数 是 一 个 包含 了 空格 的 字符 串 。 

如 果 你 用 ISO/ANSIC 语 言 编写 过 程序 ， 就 会 对 上 面 的 这 些 很 熟悉 。main 的 参数 对 应 shell 脚 本 里 的 
位 置 参数 $0、$1 等 。ISO/ANSIC 只 规定 main 必 须 返回 int， 而 X/Open 规范 则 早已 给 出 了 如 上 所 示 的 明 
确 声 明 。 

命令 行 参数 在 向 程序 传递 信息 方面 是 很 有 用 的 。 例 如 ， 我 们 可 以 在 一 个 数据 库 应 用 程序 中 使 用 命 
令 行 参 数 来 传递 想 用 的 数据 库 的 名 字 ， 这 样 就 可 以 在 多 个 数据 库 上 使 用 同一 个 程序 。 许 多 工具 程序 也 
使 用 命令 行 参 数 来 改变 程序 的 行为 或 设置 选项 。 通常 ， 你 可 以 使 用 一 个 以 短 横 线 (-) 开 头 的 命令 行 参 数 
来 设置 这 些 所 谓 的 标志 (flag) 或 开关 〈swicch)。 例 如 ，sort 程 序 可 以 用 一 个 开关 来 进行 逆向 排序 
(与 正常 排序 相反 ): 

$ sort -r fíle 

命令 行 选项 很 常用 ， 因 此 按 相同 的 方式 使 用 它们 对 程序 的 使 用 者 来 说 是 很 有 好 处 的 。 过 去 ， 每 个 
工具 程序 采用 它们 各 自 的 方式 来 使 用 命令 行 选项 ， 这 带 来 了 一 些 混乱 。 例 如 ， 请 看 下 面 这 些 命令 使 用 
参数 的 方式 : 
tar cvfB /tmp/file.tar 1024 
dd if=/dev/fd0 of=/tmp/file.dd bs=18k 
ps ax 
gcc --help 
1s -lstr 
1s -1 -s -t -r 

我 们 建议 在 应 用 程序 中 ， 所 有 的 命令 行 开关 都 应 以 一 个 短 横 线 开 头 ， 其 后 包含 单个 字母 或 数字 。 
如 果 需 要 ， 不 带 后 续 参数 的 选项 可 以 在 一 个 短 横 线 后 归并 到 一 起 。 所 以 ， 上 面 的 两 个 1s 命 令 示例 就 遵 
循 了 以 上 准则 。 如 果 某 个 选项 需要 值 ， 则 该 值 应 作为 独立 的 参数 紧 跟 在 该 选项 后 。aa 命 令 示 例 违背 了 
这 一 准则 ， 因 为 它 使 用 了 多 字符 的 选项 ， 而 且 选项 未 以 短 横 线 开头 (if=/Gev/fa0)， 而 tar 命 令 则 把 
选项 和 它们 的 值 完全 分 开 ! 我 们 建议 最 好 能 为 单字 符 开关 增加 一 个 更 长 的 、 更 有 意义 的 开关 名 ， 这 样 
你 就 可 以 使 用 -h 或 --help 选 项 来 获得 帮助 了 。 

有 些 程序 还 有 一 个 奇怪 的 地 方 ， 就 是 用 选项 :x 举例 来 说 ) 执行 与 -x 相反 的 功能 。 例 如 ， 在 第 2 
章 中 ， 我 们 使 用 命令 set -oxtrace 来 设置 shell 执 行 跟踪 ， 使 用 命令 set+o xtrace 来 关闭 它 。 

撒 开 风格 各 异 的 语法 格式 不 谈 ， 单 是 记 住 所 有 这 些 程序 选项 的 顺序 和 含义 就 已 经 非常 困难 了 。 通 
常 ,你 只 有 求助 于 -h( 帮 助 ) 选 项 或 man 手 册页 (如 果 程序 员 提 供 了 的 话 )。 你 将 在 本 章 稍 后 看 到 , getopt 
提供 了 对 这 些 问题 的 一 个 优雅 的 解决 方案 。 不 过 现在 ， 我 们 还 是 先 看 看 传递 到 程序 中 的 参数 是 怎样 处 
理 的 。 


实验 程序 参数 


下 面 这 个 程序 args .c 对 其 参数 进行 检查 : 


#include <stdio.h> 
#include «stdlib.h» 
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int main(int argc, char *argv[]) 
t 
int arg; 


for(arg = 0; arg < argc; arge*) ( 
if(argviarg][0] == '-') 
printf(*option: s\n", argv[arg]*1); 
eise 
printf(*argument %d: $s|n*, arg, argv[arg]): 
} 
exit(0); 


当 运 行 这 个 程序 时 ， 它 只 是 打印 其 参数 和 发 现 的 选项 。 我 们 的 意图 是 ， 让 该 程序 接受 一 个 字符 捉 
参数 和 一 个 由 -f 选 项 引入 的 可 选 的 文件 名 参数 。 其 他 的 选项 也 可 以 被 定义 。 

$ ./args -i -lr 'hi there' -f fred.c 

argument 0: ./args 

option: i 

option: lr 

argument 3: hi there 

option: f 

argument 5: fred.c 


这 个 程序 利用 计数 参数 argc 建 立 一 个 循环 来 检查 所 有 的 程序 参数 。 它 通过 检查 首 字母 是 否 是 短 横 
线 来 发 现 选项 。 

在 本 例 中 ， 如 果 打 算 支持 -1 选项 和 -上 选项， 那么 我 们 就 忽略 了 一 个 事实 ; -1z 选 项 应 该 和 -1 -r 
- 样 处 理 。 

X/Open 规范 (可 以 在 http://opengroup.org/ 上 找到 ) 定义 了 命令 行 选项 的 标准 用 法 (工具 语法 指南 )， 
同时 定义 了 在 C 语 言 程序 中 提供 命令 行 开关 的 标准 编程 接口 :getopt 函 数 。 





4.1.1 getopt 
为 了 帮助 我 们 遵循 这 些 准则 ，Linux 提 供 了 getopt 函 数 ， 它 支持 需要 关联 值 和 不 需要 关联 值 的 选 
项 ， 而 且 简单 易 用 。 


#include <unistd.h> 


int getopt(int argc, char *const argv[], const char *optstring); 
extern char *optarg; 
extern int optind, opterr, optopt; 


getopt 函 数 将 传递 给 程序 的 main 函 数 的 argc 和 argv 作 为 参数 ， 同 时 接受 一 个 选项 指定 符 字符 串 
optstring， 该 字符 串 告诉 getopt 哪 些 选项 可 用 ， 以 及 它们 是 否 有 关联 值 。optstring 只 是 一 个 字符 
列表 ， 每 个 字符 代表 一 个 单字 符 选 项 。 如 果 一 个 字符 后 面 紧 跟 一 个 冒号 (: )， 则 表明 该 选项 有 一 个 关 
联 值 作为 下 一 个 参数 。bash 中 的 getopts 命 令 执行 类 似 的 功能 。 

例如 ， 我 们 可 以 用 下 面 的 调用 来 处 理 上 面 的 例子 : 

getopt (argc, argv, “if:1r"); 


它 允许 几 个 简单 的 选项 ，-i、-1、-r 和 -f， 其 中 -f 选 项 后 要 紧 跟 一 个 文件 名 参数 。 使 用 相同 的 
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参数 ， 但 以 不 同 的 顺序 来 调用 命令 将 改变 程序 的 行为 。 你 可 以 在 本 章 的 下 一 个 实验 部 分 进行 尝试 。 

getopt 的 返回 值 是 argv 数 组 中 的 下 一 个 选项 字符 (如 果 有 的 话 )。 循 环 调用 getopt 就 可 以 依次 得 
到 每 个 选项 。getopt 有 如 下 行为 。 

口 如 果 选 项 有 一 个 关联 值 ， 则 外 部 变量 optarg 指 向 这 个 值 。 

口 如 果 选 项 处 理 完毕 ，getopt 返 回 -1， 特 殊 参 数 -- 将 使 getopt 停 止 扫 描 选 项 。 

口 如 果 遇 到 一 个 无 法 识别 的 选项 ，getopt 返 回 一 个 问号 (?)， 并 把 它 保存 到 外 部 变量 optopt 中 。 

口 如 果 一 个 选项 要 求 有 一 个 关联 值 ( 例 如 例子 中 的 -fF)， 但 用 户 并 未 提供 这 个 值 ，getopt 通 常 将 

返回 一 个 问号 (?)。 如 果 我 们 将 选项 字符 串 的 第 一 个 字符 设置 为 冒号 (:)， 那 么 getopt 将 在 用 
户 未 提供 值 的 情况 下 返回 冒号 O 而 不 是 问号 〈?)。 

外 部 变量 opcina 被 设置 为 下 一 个 待 处理 参 数 的 索引 。getopr 利 用 它 来 记录 自己 的 进度 。 程 序 很 
少 需要 对 这 个 变量 进行 设置 。 当 所 有 选项 参数 都 处 理 完毕 后 ，opcina 将 指向 argv 数 组 尾部 可 以 找到 
其 余 参 数 的 位 置 。 

有 些 版 本 的 getopr 会 在 第 一 个 非 选 项 参数 处 停 下 来 ， 返 回 -1 并 设置 opcina 的 值 。 而 其 他 一 些 版 
本 ， 如 Linux 提 供 的 版 本 ， 能 够 处 理 出 现在 程序 参数 中 任意 位 置 的 选项 。 注意 ， 在 这 种 情况 下 ，getopr 
实际 上 重 写 了 argv 数 组 ， 把 所 有 非 选 项 参数 都 集中 在 一 起 ， 从 argv[optina] 位 置 开 始 。 对 GNU 版 本 
的 getopt 而 言 ， 这 一 行为 是 由 环境 变量 POSIXLY_CORRECT 控 制 的 ， 如 果 它 被 设置 ，getopt 就 会 在 第 
-个 非 选项 参数 处 停 下 来 。 此 外 ， 还 有 些 getopt 版 本 会 在 遇 到 未 知 选项 时 打印 出 错 信息 。 注 意 ， 根 据 
POSIX 规 范 的 规定 ， 如 果 opterr 变 量 是 非 零 值 ，getopt 就 会 向 stderr 打 印 一 条 出 错 信 息 。 


E * getopt 函 数 


在 这 个 实验 中 ， 你 将 在 程序 中 使 用 getopt 函 数 ， 并 将 新 程序 命名 为 argopt .c: 


#include <stdio.h> 
finclude «unistd.h» 
finclude <stdlib.h> 






int main(int argc, char *argví]) 
ji 
int opt; 


while((opt = getopt(argc, argv, ":if:lr*)) != -1) ( 

switch(opt) ( 

case 'i': 

case '1': 

case 'r': 
printf(*option: &cWn", opt); 
break; 

case 'f': 
printf(*filename: $sWn*, optarg); 
break; 

case ':': 
printf ("option needs a valuein*); 
break; 

case '?': 
printf(*unknown option: &cWn*, optopt); 
break; 
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} 
} 
for(; optind < argc; optind++) 
printf(*argument: $s|n', argv[optind]); 
exit(0); 


现在 ， 当 运行 这 个 程序 时 ， 你 将 发 现 所 有 命令 行 参数 都 被 自动 处 理 了 : 
$ ./argopt -i -lr 'hi there' -f fred.c -q 

option: i 

option: 1 

option: r 

filename: fred.c 

unknown option: q 

argument: hi there 


这 个 程序 循环 调用 gecopt 对 选项 参数 进行 处 理 ， 直 到 处 理 完毕 ， 此 时 getopt 返 回 -1。 每 个 选项 


(包括 未 知 选项 和 缺少 关联 值 的 选项 ) 都 有 相应 的 处 理 动作 。 根 据 使 用 的 getopt 版 本 ， 你 看 到 的 输出 


可 | 


能 和 上 面 显 示 的 略 有 不 同 ， 尤 其 是 出 错 信息 部 分 ， 但 含义 都 是 明确 的 。 
当 所 有 选项 都 处 理 完毕 后 , 程序 像 以 前 一 样 把 其 余 参数 都 打印 出 来 , 但 这 次 是 从 opt ina 位 置 开始 。 





4. 


数 


1.2 getopt long 


许多 Linux 应 用 程序 也 接受 比 我 们 在 前 面 例子 中 所 用 的 单字 符 选项 含义 更 明确 的 参数 。GNU CH 
库 包 含 getopt 的 另 一 个 版 本 ， 称 作 getopt_long， 它 接受 以 双 划 线 (--) 开始 的 长 参数 。 


实验 getopt_long 


你 可 以 使 用 getopt_long 创 建 一 个 新 版 本 的 示例 程序 ， 它 可 以 使 用 与 前 面 选项 等 效 的 长 参数 选 


Jis 


缩 


$ ./longopt --initialize --list 'hi there' --file fred.c -q 
option: i 

option: 1 

filename: fred.c 

./longopt: invalid option -- q 

unknown option: q 

argument: hi there 


事实 上 ， 新 的 长 选项 和 原来 的 单字 符 选 项 可 以 混合 使 用 。 只 要 它们 能 够 被 区 分 开 ， 长 选项 也 可 以 
写 。 有 关联 值 的 长 选项 可 以 按照 格式 --option=value 作 为 单个 参数 给 出 ， 如 下 所 示 : 

$ ./longopt --init -1 --file=fred.c 'hi there' 

option: i 

option: 1 

filename: fred.c 

argument: hi there 

新 程序 1ongopt.c 如 下 所 示 ， 其 中 ， 以 阴影 显示 的 部 分 为 支持 长 选项 而 对 argopt .c 所 做 的 修改 : 

finclude <stdio.h> 

#include <unistd.h> 
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#include <stdlib.h> 


fdefine | GNU SOURCE 
#include «getopt.h» 


int main(int argc, char *argv[]) 
{ 

int opt; 

struct option longopts(] = ( 
("initialize", 0, NULL, 'i'), 





+ 0, NULL, '1'), 
("restart', 0, NULL, 'r'), 
(0,0,0,0)); 


while((opt = getopt long(argc, argv, ":if:lr*, longopts, NULL)) !- -1) ( 





case 'l 
case 'r': 
printf(*option: $cWn*, opt); 
break; 
case 'f': 
printf(*filename: %s\n", optarg); 
break; 
case ':': 
printf(*option needs a valuein*); 
break; 
case '?': 
printf(*unknown option: &cYn*, optopt); 
break; 
) 
) 
for(; optind < argc; optinde«) 
printf(*argument: $sWn*, argv[optind]); 
exit(0); 
) 
实验 解析 
getopt_long 函 数 比 getopt 多 两 个 参数 。 第 一 个 附加 参数 是 一 个 结构 数组 ， 它 描述 了 每 个 长 选项 
并 告诉 getopt_long 如 何 处 理 它们 。 第 二 个 附加 参数 是 一 个 变量 指针 ， 它 可 以 作为 optina 的 长 选项 版 
本 使 用 。 对 于 每 个 识别 的 长 选项 ， 它 在 长 选项 数组 中 的 索引 就 写 入 该 变量 。 在 本 例 中 ， 你 不 需要 这 一 
信息 ， 因 此 第 二 个 附加 参数 是 NULL。 
长 选项 数组 由 一 些 类 型 为 struct option 的 结构 组 成 ， 每 个 结构 描述 了 一 个 长 选项 的 行为 。 该 数 
组 必须 以 一 个 包含 全 0 的 结构 结尾 。 
长 选项 结构 在 头 文件 getopt .h 中 定义 , 并 且 该 头 文件 必须 与 常量 _GNU_soURCE 一 同 包含 进来 , 该 
常量 启用 getopt_long 功 能 。 
struct option ( 
const char *name; 


int has arg; 
int *flag; 
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int val; 
) 


该 结构 的 成 员 如 表 4-1 所 示 。 











表 4-1 
选项 成 员 说 A 
nana 长 选项 的 名 字 。 缩 写 也 可 以 接受 ， 只 要 不 与 其 他 选项 混淆 
has arg 该 选项 是 否 带 参数 。0 表 示 不 带 参数 ，1 表 示 必须 有 一 个 参数 ，2 表 示 有 一 个 可 选 参 数 
flag 设置 为 NULL 表 示 当 找 到 该 选项 时 ，getopt_long 返 回 在 成 员 val 里 给 出 的 值 ， 否 则 ， 
getopt_long 返 回 9， 并 将 val 的 值 写 入 flag 指 向 的 变量 
val gecopc_long 为 该 选项 返回 的 值 
要 了 解 GNU 对 getopt 扩 展 的 其 他 选项 及 相关 函数 ， 请 参考 getopt 的 手册 页 。 
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我 们 在 第 2 章 讨论 过 环境 变量 。 这 是 一 些 能 用 来 控制 shell 脚 本 和 其 他 程序 行为 的 变量 。 你 还 可 以 
用 它们 来 配置 用 户 环 境 。 例 如 ， 每 个 用 户 有 一 个 环境 变量 HoME， 它 定义 了 用 户 的 家 目录 ， 即 该 用 户 会 
话 的 默认 开始 位 置 。 正 如 你 已 看 到 的 ， 你 可 以 在 shell 提 示 符 中 检查 环境 变量 ; 

$ echo $HOME 

/home/neil 

你 也 可 以 使 用 shell 的 set 命 令 来 列 出 所 有 的 环境 变量 。 

UNIX 规 范 为 各 种 应 用 定义 了 许多 标准 环境 变量 ， 包 括 终端 类 型 、 默 认 的 编辑 器 、 时 区 等 。 C 语 言 
程序 可 以 通过 putenv 和 getenv 函 数 来 访问 环境 变量 。 

Winclude <stdlib.h> 





Char *getenv(const char *name); 
int putenv(const char *string); 


环境 由 一 组 格式 为 “名 字 = 值 ”的 字符 串 组 成 。getenv 函 数 以 给 定 的 名 字 搜索 环境 中 的 一 个 字符 
串 ， 并 返回 与 该 名 字 相关 的 值 。 如 果 请 求 的 变量 不 存在 ， 它 就 返回 null 。 如 果 变 量 存在 但 无 关联 值 ， 
它 将 运行 成 功 并 返回 一 个 空 字符 串 ， 即 该 字符 串 的 第 一 个 字 节 是 null 。 由 于 getenv 返 回 的 字符 让 是 
存储 在 gecenv 提 供 的 静态 空间 中 ， 所 以 如 果 想 进一步 使 用 它 ， 你 就 必须 将 它 复制 到 另 一 个 字符 站 中 ， 
以 免 它 被 后 续 的 gecenv 调 用 所 颖 盖 。 

putenv 函 数 以 一 个 格式 为 “名 字 = 值 ”的 字符 申 作为 参数 ， 并 将 该 字符 串 加 到 当前 环境 中 。 如 果 
由 于 可 用 内 存 不 足 而 不 能 扩展 环境 ， 它 会 失败 并 返回 -1。 此 时 ， 错 误 变量 errno 将 被 设置 为 ENOMEM。 

在 下 面 的 实验 中 ， 你 将 编写 一 个 程序 来 打印 所 选 的 任意 环境 变量 的 值 。 如 果 给 程序 传递 第 二 个 参 
数 ， 你 还 将 设置 环境 变量 的 值 。 


| PP 


(1) 紧 接 在 main 函 数 声 明 后 的 儿 行 代码 用 于 确保 程序 environ.c 被 正确 调用 ， 它 只 带 有 一 个 或 两 
个 参数 : 


#include <stdlib.h> 
#include <stdio.h> 
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#include <string.h> 


int main(int argc, char *argv[]) 
t 


char *var, *value; 


if(arge == 1 || argc > 3) ( 
fprintf (stderr, "usage: environ var [value]Wn*]; 
exit(1); 

) 


(2) 然后 ， 调 用 getenv 从 环境 中 取出 变量 的 值 : 


var = argv[1]; 
value = getenv(var); 
if(value) 
printf(*Variable $s has value $sn*, var, value); 
else 
printf(*Variable $s has no value\n", var); 


(3) 接 下 来 ， 检 查 程序 调用 时 是 否 有 第 二 个 参数 。 如 果 有 ， 则 通过 构造 一 个 格式 为 “名 字 = 值 ”的 
字符 串 并 调用 putenv 来 设置 变量 的 值 : a 


if(argc == 3) ( 
char *string; 
value = argv[2]; 
string = malloc(strlen(var)*strlen(value)*2); 
if(!string) ( 
fprintf(stderr, "out of memoryW"); 
exit(1); 
) 
strcpy(string,var); 
strcat (string, "="); 
strcat(string,value); 
printf('Calling putenv with: %s\n*, string); 
if(putenv(string) != 0) ( 
fprintf (stderr,"putenv failedin*); 
free(string); 
exit(1); 
) 


(4) 最 后 ， 再 次 调用 getenv 来 查看 变量 的 新 值 : 
value = getenv(var); 
if(value) 
printf ("New value of $s is ¢s\n", var, value); 
else 
printf ("New value of ts is null??Wn*, var); 


exit(0); 

3 

运行 这 个 程序 ， 你 可 以 查看 和 修改 环境 变量 : 
$ ./environ HOME 

Variable HOME has value /home/neil 
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$ ./environ FRED 
Variable FRED has no value 

$ ./environ FRED hello 
Variable FRED has no value 
Calling putenv with: FRED-hello 
New value of FRED is hello 

$ ./environ FRED 

Variable FRED has no value 


注意 ; 环境 仅 对 程序 本 身 有 效 。 你 在 程序 里 做 的 改变 不 会 反映 到 外 部 环境 中 ， 这 是 因为 变量 的 值 
不 会 从 子 进程 〈 你 的 程序 ) 传播 到 父 进程 shell)。 
4.2.1 环境 变量 的 用 途 

程序 经 常 使 用 环境 变量 来 改变 它们 的 工作 方式 。 用 户 可 以 通过 以 下 方式 设置 环境 变量 的 值 ， 在 默 
认 环境 中 设置 、 通 过 登录 shell 读 取 的 .profile 文 件 来 设置 、 使 用 shell 专 用 的 启动 文件 (rc) 或 在 shell 
命令 行 上 对 变量 进行 设 定 。 例 如 : 

$ ./environ FRED 

Variable FRED has no value 


$ FREDehello ./environ FRED 
Variable FRED has value hello 


shell 将 行 首 的 变量 赋值 作为 对 环境 变量 的 临时 改变 。 在 上 面 的 第 二 个 例子 中 ， 程 序 environ 将 运 
行 在 一 个 变量 FRED 有 一 个 赋值 的 环境 中 。 

举 个 例子 ， 在 CD 数据 库 应 用 程序 的 未 来 版 本 中 ， 你 可 以 通过 改变 一 个 环境 变量 ， 比 如 cDDB， 来 
指定 所 用 的 数据 库 。 这 样 ,每 个 用 户 就 能 指定 自己 的 默认 值 , 或 者 在 每 次 运行 时 使 用 shell 命 令 来 设 定 : 


$ CDDBemycds; export CDDB 
$ cdapp 


或 
$ CDDBemycds cdapp 
环境 变量 是 一 把 双 刃 剑 ， 使 用 它 的 时 候 要 小 心 ! 与 命令 行 选项 相 比 ， 它 们 对 用 户 来 说 更 
加 “隐藏 "， 这 样 就 使 得 程序 的 调试 变 得 更 加 困难 。 从 某 种 意义 上 来 说 ， 环 境 变量 就 像 全 局 
变量 一 样 ， 它 们 会 改变 程序 的 行为 ， 产 生 不 可 预期 的 结果 .。 


4.2.2 environ 变量 


正如 你 已 看 到 的 ， 程 序 的 环境 由 一 组 格式 为 “名 字 = 值 ”的 字符 串 组 成 。 程 序 可 以 通过 environ 
变量 直接 访问 这 个 字符 串 数组 。environ 变 量 的 声明 如 下 所 示 : 
#include <stdlib.h> 


extern char **environ; 


实验 environ 变 量 


下 面 这 个 程序 showenv.c 使 用 environ 变 量 打印 环境 变量 : 


finclude «stdlib.h» 
*include <stdio.h> 
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extern char **environ; 


int main() 
t 


char **env = environ; 


while(*env) ( 
printf('&sWn", *env) ; 
enves; 
) 
exit(0); 
) 


当 在 Linux 系 统 中 运行 该 程序 时 ， 你 将 得 到 如 下 的 输出 〈 略 做 删 减 )。 这 些 变量 的 数目 、 出 现 顺序 
和 值 取决 于 操作 系统 的 版 本 、 所 用 的 shell 以 及 程序 运行 时 的 用 户 设置 。 


$ ./showenv 
HOSTNAME-tilde.provider.com 


LOGNAME-neil 
MAIL-/var/spool/mail/neil 
TERM-xterm 

HOSTTYPE-i386 

PATH /usr/local/bin:/bin:/usr/bin: 
HOME-/usr/neil 

LS OPTIONS--N --color-tty -T 0 
SHELL-/bin/bash 

OSTYPE-Linux 


这 个 程序 遍历 environ 变 量 〈 一 个 以 nul1 结 尾 的 字符 串 数组 )， 并 打印 出 整个 环境 。 





4.3 ”时间 和 日 期 
通常 能 确定 时 间 和 日 期 对 一 个 程序 来 说 是 非常 有 用 的 。 程 序 可 能 希望 记录 它 运 行 的 时 间 ， 或 者 可 
能 需要 在 某 些 时 候 改 变 它 的 运行 方式 。 例 如 ， 一 个 游戏 可 能 拒绝 在 工作 时 间 运 行 ， 或 者 一 个 定时 备份 
程序 可 能 想 等 到 每 天 的 凌晨 才 开 始 一 个 自动 备份 。 
所 有 的 UNIX 系 统 都 使 用 同一 个 时 间 和 日 期 的 起 点 : 格林 尼 治 时 间 (GMT) 1970 年 1 月 1 
日 午夜 (0 点 )。 这 是 “UNIX 纪 元 的 起 点 "，Linux 也 不 例外 。 Linux 系 统 中 所 有 的 时 间 都 以 从 
那 时 起 经 过 的 秒 数 来 衡量 .这 和 MS-DOS 处 理 时 间 的 方法 类 似 ， 只 是 MS-DOS 纪 元 始 于 1980 
年 。 其 他 系统 使 用 其 他 的 纪元 起 始 时 间 。 
时 间 通 过 一 个 预定 义 的 类 型 time_t 来 处 理 . 这 是 一 个 大 到 能 够 容纳 以 秒 计算 的 日 期 和 时 间 的 整数 
类 型 。 在 Linux 系 统 中 ， 它 是 一 个 长 整 型 ， 与 处 理 时 间 值 的 函数 一 起 定义 在 头 文件 time.h 中 。 
绝 不 要 想当然 地 以 为 ,时间 就 是 32 位 的 . 在 使 用 32 位 time_t 类 型 的 UNIX 和 Linux 系 统 中 ， 
时 间 将 在 2038 年 回 绕 。 到 那 时 ,我 们 希望 系统 都 开始 使 用 大 于 32 位 的 time_t 类 型 。 随 着 最 近 
64 位 处 理 器 进入 主流 处 理 器 市 场 ， 这 一 趋势 几乎 是 必然 的 。 
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#include «time.h» 


time t time(time t *tloc); 
你 可 以 通过 调用 Fime 函 数 得 到 底层 的 时 间 值 ， 它 返回 的 是 从 纪元 开始 至 今 的 秒 数 。 如 果 tloc 不 是 
一 个 空 指针 ，time 函 数 还 会 把 返回 值 写 入 tloc 指 针 指向 的 位 置 。 


EE 上 time 函数 


下 面 这 个 简单 的 程序 envtime.c 演 示 了 time 函 数 的 用 法 : 


#include <time.h> 

#include <stdio.h> 
#include <unistd.h> 
#include <stdlib.h> 





int main() 
{ 
int i; 
time t the time; 


for(i = 1; i <= 10; i++) ( 
the time = time((time t *)0); 
printf(*The time is $ldin', the time); 
Sleep(2); 
) 
exit(0); 
) 


运行 这 个 程序 ， 它 会 在 20 秒 时 间 内 每 两 秒 钟 打印 一 次 底层 的 时 间 值 。 


1179643852 
1179643854 
1179643856 
1179643858 
1179643860 
1179643862 
1179643864 
1179643866 
1179643868 
1179643870 





这 个 程序 用 一 个 空 指针 参数 调用 time 函 数 ， 返 回 以 秒 数 计算 的 时 间 和 日 期 。 程序 休眠 两 秒 后 再 重 
复 调用 time 函 数 ， 总 共 调 用 10 次 。 

以 从 1970 年 开始 计算 的 秒 数 来 表示 时 间 和 日 期 ， 对 测算 某 些 事情 持续 的 时 间 是 很 有 用 的 。 你 可 以 
把 它 考虑 为 简单 地 把 两 次 调用 time 得 到 的 值 相 减 .。 然而 ISO/ANSIC 标 准 委员 会 经 过 审议 ,并 没有 规定 
用 time_t 类 型 来 测量 任意 时 间 之 间 的 秒 数 ， 他 们 发 明了 一 个 函数 difftime， 该 函数 用 来 计算 两 个 
time_t 值 之 间 的 秒 数 并 以 double 类 型 返回 它 。 

#include «time.h» 


double difftime(time t timel, time t time2); 
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difftime 函 数 计算 两 个 时 间 值 之 间 的 差 ， 并 将 Fimel-time2 的 值 作为 浮 点 数 返 回 。 对 Linux 来 说 , 
time 函 数 的 返回 值 是 一 个 易于 处 理 的 秒 数 ， 但 考虑 到 最 大 限度 的 可 移植 性 ， 你 最 好 使 用 aiffcime。 

为 了 提供 《对 人 类 ) 更 有 意义 的 时 间 和 日 期 ， 你 需要 把 时 间 值 转换 为 可 读 的 时 间 和 日 期 。 有 一 些 
标准 函数 可 以 帮 我 们 做 到 这 一 点 。 

gmtime 函 数 把 底层 时 间 值 分 解 为 一 个 结构 ， 该 结构 包含 一 些 常用 的 成 员 ; 

#include «time.h» 


struct tm *gmtime(const time t timeval); 
tm 结构 被 定义 为 至 少 包含 表 4-2 所 示 的 成 员 。 








表 4-2 

tm 成 员 Rm 
int tm sec E». 0-61 
int tm min 4. 0-59 
int tm hour MH. 0-23 
int tm mday 月 份 中 的 日 期 ，1~31 
int tm mon Hf. 0-11 (一 月 份 为 0) 
int tm year 从 1900 年 开始 计算 的 年 份 
int tm wday 星期 几 ，0-6〔〈 周 日 为 0) 
int tm yday 年 份 中 的 日 期 ，0-365 


是 否 夏令 时 
tm_sec 的 范围 允许 临时 间 秒 或 双 间 秒 。 











实 验 omtime 函 数 
下 面 这 个 程序 gmcime.c 利 用 cm 结构 和 gmcime 函 数 打印 出 当前 时 间 和 日 期 : 


#include «time.h» 


#include <stdio.h> 
#include <stdlib.h> 


int main() 

t 
struct tm *tm ptr; 
time t the time; 


(void) time(&the time); 
tm ptr = gmtime(&the time); 


printf ("Raw time is $ldWn*, the time); 
printf('gmtime gives: Wn*); 
printf('date: $02d/302d/802dWn*, 

tm ptr-»tm year, tm ptr-»tm mon*l, tm ptr-»tm mday); 
printf(*time: $02d:$02d:$02din*, 

tm ptr-»tm hour, tm ptr-»tm min, tm ptr-»tm sec); 
exit(0); 
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运行 这 个 程序 ， 你 将 得 到 含义 明显 的 时 间 和 日 期 : 

$ ./gmtime; date 

Raw time is 1179644196 

gmtime gives: 

date: 107/05/20 

time: 06:56:36 

Sun May 20 07:56:37 BST 2007 

这 个 程序 调用 time 函 数 得 到 底层 的 时 间 值 ， 然 后 调用 gmt ime 将 该 值 转换 为 一 个 包含 有 用 的 时 间 
和 日 期 值 的 结构 。 最 后 ， 程 序 用 print 5 将 这 些 信息 打印 出 来 。 严 格 来 说 ， 你 不 应 该 用 这 种 方法 打印 原 
始 时 间 值 ， 因 为 我 们 并 不 能 保证 它 在 所 有 系统 上 都 是 1ong 类 型 的 值 。 我 们 在 运行 gmt ime 程 序 后 立即 
运行 Gate 命 令 以 比较 它们 的 输出 。 

不 过 ， 这 儿 有 个 小 问题 。 如 果 在 格林 尼 治 标准 时 间 (GMT) 之 外 的 时 区 运行 这 个 程序 ， 或 者 所 在 
的 地 方 像 本 例 中 那样 采用 了 夏令 时 ， 你 会 发 现时 间 《〈 可 能 还 有 日 期 ) 是 不 对 的 。 这 是 因为 amtime 按 
GMT 返 回 时 间 〈 现 在 GMT 被 称 为 世界 标准 时 间 ， 或 UTC)。Linux 和 UNIX 这 样 做 是 为 了 同步 全 球 各 地 
的 所 有 程序 和 系统 。 不 同时 区 同一 时 刻 创建 的 文件 都 会 有 相同 的 创建 时 间 。 要 看 当地 时 间 ， 你 需要 使 
用 localtime 函 数 。 

#include <time.h> 





struct tm *localtime(const time t *timeval); 

localtime 函 数 和 gmt ime 一 样 , 除了 它 返回 的 结构 中 包含 的 值 已 根据 当地 时 区 和 是 否 采用 夏令 时 
做 了 调整 。 如 果 把 上 面 程序 中 的 gmt ime 换 成 1ocalt ime， 再 编译 运行 一 次 ， 你 就 会 看 到 正确 的 时 间 和 
日 期 了 。 

要 把 已 分 解 出 来 的 cm 结构 再 转换 为 原始 的 time_t 时 间 值 ， 你 可 以 使 用 mktime 函 数 ; 

#include <time.h> 

time t mktime(struct tm *timeptr); 

如 果 tm 结 构 不 能 被 表示 为 time_t 值 ，mktime 将 返回 -1。 

为 了 得 到 更 “友好 "的 时 间 和 日 期 表示 , 像 4ate 命 令 输 出 的 那样 , 你 可 以 使 用 asctime 函 数 和 ctime 
函数 : 

#include <time.h> 

Char *asctime(const struct tm *timeptr); 

char *ctime(const time t *timeval); 

asctime 函 数 返回 一 个 字符 串 ， 它 表示 由 tm 结构 timeptr 所 给 出 的 时 间 和 日 期 。 这 个 返回 的 字符 
串 有 类 似 下 面 的 格式 : 

Sun Jun 9 12:34:56 2007\n\0 

它 总 是 这 种 长 度 为 26 个 字符 的 固定 格式 。ctime 函 数 等 效 于 调用 下 面 这 个 函数 : 

asctime {localtime (timeval)) 


它 以 原始 时 间 值 为 参数 ， 并 将 它 转换 为 一 个 更 易 读 的 本 地 时 间 。 
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xw ctime 函 数 


在 本 例 中 ， 使 用 下 面 的 代码 来 查看 ccime 函 数 的 用 法 : 
#include «time.h» 

#include <stdio.h> 

#include <stdlib.h> 





int main() 
€ 
time t timeval; 


(void)time(&timeval); 
printf('The date is: $s*, ctime(&timeval)); 
exit(0); 

) 

编译 并 运行 这 个 ccime.c 程 序 ， 你 将 看 到 如 下 所 示 的 输出 ; 

$ ./ctime 

The date is: Sat Jun 9 08:02:08 2007 


ctime,c 程 序 调用 cime 函 数 得 到 底层 时 间 值 ， 让 ctime 做 所 有 的 艰巨 工作 ， 把 时 间 值 转换 成 可 读 
的 字符 串 ， 然 后 打印 它 。 

为 了 对 时 间 和 日 期 字符 串 的 格式 有 更 多 控制 ，Linux 和 现代 的 类 UNIX 系 统 提供 了 strftime 函 数 。 
它 很 像 是 一 个 针对 时 间 和 日 期 的 sprintf 函 数 ， 工 作 方式 也 很 类 似 : 

#include <time.h> 


size t strftime(char *s, size t maxsize, const char *format, struct tm *timeptr); 

strftime 函 数 格式 化 timeptr 指 针 指向 的 tm 结构 所 表示 的 时 间 和 日 期 ， 并 将 结果 放 在 字符 串 s 中 。 
字符 申 被 指定 至少) maxsize 个 字符 长 。format 字 符 串 用 于 控制 写 入 字符 串 s 的 字符 。 与 printf 一 样 ， 
它 包 含 将 被 传 给 字符 串 的 普通 字符 和 用 于 格式 化 时 间 和 日 期 元 素 的 转换 控制 符 。 转 换 控制 符 见 表 4-3。 











表 4-3 
转换 控制 符 说 了 明 转换 控制 符 wo 明 
Ma 星期 儿 的 缩写 和 星期 几 ，1~7〔 周 一 为 1) 
bul 星期 几 的 全 称 MI 年 中 的 第 几 周 ，01~53〔 周 日 是 一 周 
ab 月 份 的 缩写 的 第 一 天 ) 
bid 月 份 的 全 称 w 年 中 的 第 几 周 ，01~53 〈 周 一 是 一 周 
c 日 期 和 时 间 的 第 一 天 》 
sa 月 份 中 的 日 期 ，01~31 w 星期 几 ，0-~6〔 周 日 为 0》 
bd 小 时 ，00-23 ax 本 地 格式 的 日 期 
s 12 小 时 制 中 的 小 时 ，01~12 sx 本 地 格式 的 时 间 
tj 年 份 中 的 日 期 ，001~366 y 年 份 减 去 1900 
Ae 年 份 中 的 月 份 ，01~12 s 年 份 
M Abb, 00-59 az 时 区 名 
tp am. CEF) Spm. CFE) hid Ys 


M E». 00-61 
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因此 ，gate 命 令 输出 的 普通 日 期 就 相当 于 strftime 格 式 字符 串 中 的 : 

"$a èb td $H:$M:$S $Y" 

为 了 读 取 日 期 ， 你 可 以 使 用 scrptime 函 数 ， 该 函数 以 一 个 代表 日 期 和 时 间 的 字符 串 为 参数 ， 并 创 
建 表示 同一 日 期 和 时 间 的 tm 结构 : 

#include <time.h> 


char *strptime(const char *buf, const char *format, struct tm *timeptr); 

format 字 符 串 的 构建 方式 和 strftime 的 format 字 符 串 完全 一 样 。 strptime 在 字符 串 扫描 方面 类 
似 于 sscanf 函 数 ， 也 是 查找 可 识别 字段 ， 并 把 它们 写 入 对 应 的 变量 中 。 只 是 这 里 是 根据 format 字 符 
串 来 填充 tm 结构 的 成 员 。 不 过 ，scrptime 的 转换 控制 符 与 scrftime 的 相 比 ， 限 制 要 稍微 松 一 些 ， 因 
为 strptime 中 的 星期 几 和 月 份 用 缩写 和 全 称 都 行 ， 两 者 都 匹配 scrptime 中 的 sa 控制 符 ， 此 外 ， 
strftime 对 小 于 10 的 数字 总 以 0 开头 ， 而 scrptime 则 把 它 看 作 是 可 选 的 。 

strptime 返 回 一 个 指针 ,指向 转换 过 程 处 理 的 最 后 一 个 字符 后 面 的 那个 字符 。 如 果 碰 到 不 能 转换 
的 字符 , 转换 过 程 就 在 该 处 停 下 来 。 调用 程序 需要 检查 是 否 已 从 传递 的 字符 串 中 读 入 了 足够 多 的 数据 ， 
以 确保 tm 结构 中 写 入 了 有 意义 的 值 。 


实验 atrftime 函 数 和 strptime 函 数 


请 留意 下 面 这 个 程序 中 选用 的 转换 控制 符 : 


#include <time.h> 
#include «stdio.h» 
#include «stdlib.h» 








int main() 
{ 
struct tm *tm ptr, timestruct; 
time t the time; 
char buf[256]; 
char *result; 


(void) time(&the time); 

tm ptr - localtime(&the time); 

strftime(buf, 256, "3A %d 1B, SI:tS $p*, tm ptr); 
printf(*strftime gives: ¢s\n", buf); 

strcpy (buf, "Thu 26 July 2007, 17:53 will do fine"); 


printf(*'calling strptime with: %s\n", buf); 
tm ptr = &timestruct; 


result = strptime(buf,"$a td Sb &Y, $R', tm ptr); 
printf('strptime consumed up to: $sWn*, result); 


printf('strptime gives: Wn"); 
printf('date: $02d/1020/t02dn*, 
tm ptr-»tm year % 100, tm ptr-»tm mon«l, tm ptr-»tm mday): 
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printf(*time: $02d:$02dWn*, 
tm ptr-»tm hour, tm ptr-»tm min); 
exit(0); 

) 

编译 并 运行 这 个 程序 strftime.c， 你 将 得 到 : 

$ ./strftime 

strftime gives: Saturday 09 June, 08:16 AM 

calling strptime with: Thu 26 July 2007, 17:53 will do fine 

strptime consumed up to: will do fine 

Strptime gives: 

date: 07/07/26 

time: 17:53 

实验 解析 

strftime 程 序 通过 调用 time 和 localtime 得 到 当前 的 本 地 时 间 。 然后 , 它 通过 调用 带 有 合适 的 格 
式 参 数 的 strftime 将 时 间 转 换 成 可 读 的 格式 。 为 演示 strptime 的 用 法 ， 程 序 构建 了 一 个 包含 日 期 和 
时 间 的 字符 串 ， 然 后 调用 scrpcime 将 原始 时 间 和 日 期 值 提取 并 打印 出 来 。 转 换 控制 符 %R 是 strptime 
中 对 %H:%M 的 缩写 形式 。 

注意 ， 要 成 功 地 扫描 日 期 ，strptime 需 要 一 个 准确 的 格式 字符 串 ， 这 一 点 非常 重要 。 一 般 来 说 ， 
该 函数 不 会 准确 扫描 读 自 用 户 的 日 期 ， 除 非 用 户 输入 的 格式 非常 严格 。 

编译 strftime.c 时 ， 你 可 能 会 看 到 编译 器 有 一 个 警告 信息 。 这 是 因为 GNU 库 在 默认 情况 下 并 未 
声明 strptime 函 数 。 要 解决 这 个 问题 , 你 需要 明确 请 求 使 用 X/Open 的 标准 功能 , 这 需要 在 包含 time.h 
头 文件 之 前 加 上 如 下 一 行 : 

#define _XOPEN_SOURCE 


4.4 临时 文件 


很 多 情况 下 ， 程 序 会 利用 一 些 文件 形式 的 临时 存储 手段 。 这 : 文件 可 能 保存 着 一 个 计算 的 中 
间 结 果 ， 也 可 能 是 关键 操作 前 的 文件 备份 。 例 如 ， 一 个 数据 库 应 用 程序 在 删除 记录 时 就 可 能 使 用 临时 
文件 。 该 文件 收集 需要 保留 的 数据 库 条 目 ， 然 后 在 处 理 结束 后 ， 这 个 临时 文件 就 变 成 新 的 数据 库 ， 原 
来 文件 则 被 删除 。 

临时 文件 的 这 种 用 法 很 常见 ， 但 也 有 一 个 隐藏 的 缺点 。 你 必须 确保 应 用 程序 为 临时 文件 选取 的 文 
件 名 是 唯一 的 。 否 则 ， 因 为 Linux 是 一 个 多 任务 系统 ， 另 一 个 程序 就 可 能 选择 同样 的 文件 名 ， 从 而 导 
致 两 个 程序 互相 干扰 。 

用 empnam 函 数 可 以 生成 一 个 唯一 的 文件 名 : 

#include <stdio.h> 








Char *tmpnam(char *s); 

tmpnam 函 数 返回 一 个 不 与 任何 已 存在 文件 同名 的 有 效 文件 名 。 如 果 字 符 串 s 不 为 空 ， 文 件 名 也 会 
写 入 它 。 对 cmpnam 的 后 续 调 用 会 覆盖 存放 返回 值 的 静态 存储 区 ， 所 以 如 果 tmpnam 要 被 多 次 调用 ， 就 
有 必要 给 它 传递 一 个 字符 串 参数 了 。 这 个 字符 捉 的 长 度 至 少 要 有 L_tmpnam (通常 为 20) 个 字符 。 
cmpnam 可 以 被 一 个 程序 最 多 调用 TMP_MAx 次 〈 至 少 为 儿 千 次 )， 每 次 它 都 会 返回 一 个 不 同 的 文件 名 。 

如 果 遇 到 需要 立刻 使 用 临时 文件 的 情况 ， 你 可 以 用 tmpfile 函 数 在 给 它 命名 的 同时 打开 它 。 
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非常 重要 ， 因 为 另 一 个 程序 可 能 会 创建 出 一 个 与 tmpnam 返 回 的 文件 名 同名 的 文件 。tmpfile 函 数 则 完 
全 避免 了 这 个 问题 的 发 生 : 


#include «stdio.h» 


FILE *tmpfile(void); 

tmpfile 函 数 返回 一 个 文件 流 指针 ， 它 指向 一 个 唯一 的 临时 文件 。 该 文件 以 读 写 方式 打开 〈 通 过 
w+ 方式 的 fopen)， 当 对 它 的 所 有 引用 全 部 关闭 时 ， 该 文件 会 被 自动 删除 。 

如 果 出 错 ，tmpfile 返 回 空 指针 并 设置 errno 的 值 。 


实验 | tmpnam 和 tmpfile 
让 我 们 来 看 看 这 两 个 函数 的 用 法 : 


#include <stdio.h> 
#include <stdlib.h> 


int main() 


char tmpname[L tmpnam]; 
char *filename; 


FILE *tmpfp; 
filename = tmpnam(tmpname); 


printf ("Temporary file name is: %s\n", filename); 
tmpfp = tmpfile(); 
if(tmpfp) 
printf(*Opened a temporary file OKn*); 
eise 
perror(*tmpfile"); 
exit(0); 
) 


编译 并 运行 程序 tmpnam.c， 你 可 以 看 到 tmpnam 生 成 的 唯一 文件 名 : 
$ ./tmpnam 


Temporary file name is: /tmp/file2S64zc 
Opened a temporary file OK 


这 个 程序 调用 empnam 为 临时 文件 生成 一 个 唯一 的 文件 名 。 如 果 要 用 它 ， 你 必须 尽 可 能 快 地 打开 它 
以 减 小 另 一 个 程序 用 同样 的 名 字 打开 文件 的 风险 。rmpfile 调 用 同时 创建 和 打开 一 个 临时 文件 ， 这 样 
就 避免 了 这 一 风险 。 事 实 上 ， 当 编译 一 个 使 用 cmpnam 函 数 的 程序 时 ，GNU C 编 译 器 会 对 它 的 使 用 给 出 
警告 信息 。 

UNIX 有 另 一 种 生成 临时 文件 名 的 方式 ， 就 是 使 用 mktemp 和 mkstemp 函 数 。Linux 也 支持 这 两 个 函 
数 ， 它 们 与 tmpnam 类 似 ， 不 同 之 处 在 于 可 以 为 临时 文件 名 指定 一 个 模板 ， 模 板 可 以 让 你 对 文件 的 存放 
位 置 和 名 字 有 更 多 的 控制 : 

#include <stdlib.h> 





Char *mktemp(char *template); 
int mkstemp(char *template); 
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mktemp 函 数 以 给 定 的 模板 为 基础 创建 一 个 唯一 的 文件 名 。template 参 数 必须 是 一 个 以 6 个 x 字 符 
结尾 的 字符 串 。mktemp 函 数 用 有 效 文件 名 字符 的 一 个 唯一 组 合 来 替换 这 些 x 字 符 。 它 返回 一 个 指向 生 
成 的 字符 串 的 指针 ， 如 果 不 能 生成 一 个 唯一 的 名 字 ， 它 就 返回 一 个 空 指针 。 

mkstemp 函 数 类 似 于 tmpfile, 它 也 是 同时 创建 并 打开 一 个 临时 文件 ,文件 名 的 生成 方法 和 mktemp 
一 样 ， 但 是 它 的 返回 值 是 一 个 打开 的 、 底 层 的 文件 描述 符 。 

你 应 该 在 程序 中 使 用 “创建 并 打开 ”函数 rmpfile 和 mkstemp， 而 不 要 使 用 mpnam 和 
mktemp。 





4.5 用 户 信息 


除了 著名 的 init 程 序 以 外 ， 所 有 的 Linux 程 序 都 是 由 其 他 程序 或 用 户 启动 的 。 你 将 在 第 11 章 中 对 
中 的 程序 或 进程 的 交互 进行 更 深入 的 学 习 。 用 户 通常 是 在 一 个 响应 他 们 命令 的 shell 中 启动 各 
你 已 经 看 到 ， 程 序 能 够 通过 检查 环境 变量 和 读 取 系统 时 钟 来 在 很 大 程度 上 了 解 它 所 处 的 运行 环境 。 程 
序 也 能 够 发 现 它 的 使 用 者 的 相关 信息 。 

当 一 个 用 户 要 登录 进 Linux 系 统 时 ， 他 有 一 个 用 户 名 和 密码 。 一 旦 用 户 名 和 密码 通过 验证 ， 用 户 
就 可 以 进入 一 个 shell。 从 内 部 机 制 来 说 ， 用 户 还 有 一 个 唯一 的 用 户 标识 符 UID。Linux 运 行 的 每 个 程序 
实际 上 都 是 以 某 个 用 户 的 名 义 在 运行 ， 因 此 都 有 一 个 关联 的 UID。 

你 可 以 对 程序 进行 设置 ， 让 它们 的 运行 看 上 去 好 像 是 由 另 一 个 用 户 启动 的 。 当 一 个 程序 的 SUID 位 
被 置 位 时 ， 它 的 运行 就 好 像 是 由 该 可 执行 文件 的 属 主 启动 的 。 当 su 命令 被 执行 时 ， 程 序 的 运行 就 好 像 
它 是 由 超级 用 户 启动 的 , 它 随后 验证 用 户 的 访问 权限 ,将 UID 改 为 目标 账户 的 UID 值 并 执行 该 账户 的 登 
录 shell。 采 用 这 种 方式 还 可 以 允许 一 个 程序 的 运行 就 好 像 是 由 另 一 个 用 户 启动 的 ， 它 经 常 被 系统 管理 
员 用 来 执行 一 些 维护 任务 。 

既然 UID 是 用 户 身份 的 关键 ， 我 们 就 从 它 开始 吧 。 

UID 有 它 自 己 的 类 型 一 uia_t, 它 定义 在 头 文件 sys/types.h 中 。 它 通常 是 一 个 小 整数 。 有 些 UID 
是 系统 预定 义 的 ， 其 他 的 则 是 系统 管理 员 在 添加 新 用 户 时 创建 的 。 一 般 情 况 下， 用 户 的 UID 值 都 大 于 
100. 


fWinclude <sys/types.h> 
#include <unistd.h> 








uid t getuid(void); 
char *getlogin(void); 


getuiG 函 数 返回 程序 关联 的 UID， 它 通常 是 启动 程序 的 用 户 的 UID。 

getlogin 函 数 返回 与 当前 用 户 关 联 的 登录 名 。 

系统 文件 /etc/passwa 包 含 一 个 用 户 账号 数据 库 。 它 由 行 组 成 ， 每 行 对 应 一 个 用 户 , 包括 用 户 名 、 
加 密 口令 、 用 户 标识 符 (UID)、 组 标识 符 (GID)、 全 名 、 家 目录 和 默认 shell。 下 面 是 一 个 示例 行 : 

neil:zBqxfqedfpk:500:100:Neil Matthew:/home/neil:/bin/bash 

如 果 编写 一 个 程序 ， 它 能 确定 启动 它 的 用 户 的 UID， 那 么 你 就 可 以 对 它 进行 扩展 ， 让 它 查 找 密码 
文件 以 找到 用 户 的 登录 名 和 全 名 。 但 我 们 并 不 推荐 这 种 做 法 ， 因 为 为 了 提高 系统 的 安全 性 ， 现 代 的 类 
UNIX 系 统 都 不 再 使 用 简单 的 密码 文件 了 。 许 多 系统 ， 包 括 Linux， 都 有 一 个 使 用 shadow 密 码 文件 的 选 
项 , 原来 的 密码 文件 中 不 再 包含 任何 有 用 的 加 密 口 令 信息 (这 些 信息 通常 存放 在 /etc/shadow 文 件 中 ， 
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这 是 一 个 普通 用 户 不 能 读 取 的 文件 )。 为 此 ， 人 们 定义 了 一 组 函数 来 提供 一 个 标准 而 又 有 效 的 获取 用 
户 信息 的 编程 接口 : 


#include «sys/types.h» 
#include «pwd.h» 

struct passwd *getpwuid(uid t uid); 

struct passwd *getpwnam(const char *name); 


密码 数据 库 结构 passwa 定 义 在 头 文件 pwa.h 中 ， 它 包含 表 4-4 中 的 成 员 。 








R 44 
passwd 成 员 » 明 
Char “pu_name APERE 
uid t pw uid UID 号 
gid t pw gid GID 号 
char *py.dir 用 户 家 目录 
char *pw_gecos 用 户 全 名 
char *pw shell 用 户 默认 shell 


有 些 UNIX 系 统 可 能 对 用 户 全 名 字段 使 用 一 个 不 同 的 名 字 。 在 某 些 系统 〔 如 Linux) k, à 
pw_gecos， 而 在 其 他 系统 上 ， 它 是 pw_comment。 这 就 意味 着 ， 我 们 不 能 对 它 给 出 一 个 统一 的 用 法 。 

getpwuid 和 getpwnam 函 数 都 返回 一 个 指针 ， 该 指针 指向 与 某 个 用 户 对 应 的 passwa 结 构 。 这 个 用 
户 通 过 getpwuid 的 UID 参 数 或 通过 getpwnam 的 用 户 登录 名 参数 来 确定 。 出 错时 ， 它 们 都 返回 一 个 空 指 
针 并 设置 errno。 


EU meum 
下 面 的 程序 user .c 从 密码 数据 库 中 提取 出 一 些 用 户 信息 : 


#include <sys/types.h> 
#include «pwd.h» 
#include <stdio.h> 
#include «unistd.h» 
#include «stdlib.h» 


是 








int main() 


uid t uid; 
gid t gid; 


struct passwd *pw; 

uid = getuid(); 

gid = getgid(); 

printf("User is %s\n", getlogin()); 
Printf{"User IDs: uid-td, gid-$d|n', uid, gid); 


pw = getpwuid(uid); 
Printf ("UID passwd entry:Vn name-$s, uid-$d, gid-*d, home-ts, shell-$sin', 
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pw-»pw name, pw-»pw uid, pw-»pw gid, pw-»pw dir, pw-»pw shell); 


pw = getpwnam("root"); 
printf(*'root passwd entry:Wn*); 
printf(*name-$s, uid=%d, gid=%d, home-$s, shell-$sin', 
pw-»pw name, pw-»pw uid, pw-»pw gid, pw-»pw dir, pw-»pw shell]; 
exit(0); 
Y 


它 给 出 如 下 的 输出 ， 在 不 同 的 Linux 和 UNIX 版 本 中 ， 输 出 结果 可 能 会 稍 有 差异 ; 
$ ./user 

User is neil 

User IDs: uid-1000, gid-100 

UID passwd entry: 

name-neil, uid-1000, gid-100, home-/home/neil, shellz/bin/bash 

root passwd entry: 
name-root, uid=0, gid-0, homes/root, shellz/bin/bash 








用 getuia 获 得 当前 用 户 的 UID， 再 把 这 个 UID 用 在 getpwuia 函 数 中 来 获得 密码 文件 
中 保存 的 详细 信息 。 此 外 ， 我 们 还 演示 了 通过 在 gecpwnam 中 给 出 用 户 名 root 来 获得 用 户 信息 的 方法 。 
如 果 查 看 Linux 的 源 代码 ， 你 就 能 在 ia 命令 的 源 代码 中 看 到 另 一 个 使 用 gecuid 函 数 的 
例子 。 
如 果 要 扫描 密码 文件 中 的 所 有 信息 ， 你 可 以 使 用 gecpwenc 函 数 。 它 的 作用 是 依次 取出 文件 数据 项 ; 


#include «pwd.h» 
#include <sys/types.h> 





void endpwent (void); 

struct passwd *getpwent (void); 

void setpwent (void); 

gecpwent 函 数 依次 返回 每 个 用 户 的 信息 数据 项 。 当 到 达 文件 尾 时 ， 它 返回 一 个 空 指针 。 如 果 已 经 
扫描 了 足够 多 的 数据 项 ， 你 可 以 使 用 endpwent 函数 来 终止 处 理 过 程 。setpwent 函数 重 置 读 指针 到 密 
码 文件 的 开始 位 置 , 这 样 下 一 个 getpwent 调 用 将 重新 开始 一 个 新 的 扫描 , 这 些 函 数 的 操作 方式 与 我 们 
在 第 3 章 讨论 的 目录 扫描 函数 opendir、readdir 和 closedir 非 常 相似 。 

《有 效 的 和 实际 的 ) 用 户 和 组 标识 符 还 可 以 被 其 他 一 些 不 太 常用 的 函数 获得 : 

#include <sys/types.h> 

#include <unistd.h> 


wid t geteuid(void); 


gid t getgid(void); 
gid t getegid(void); 
int setuid(uid t uid); 
int setgid(gid t gid); 


组 标识 符 和 有 效用 户 标识 符 的 详细 资料 请 参考 系统 的 手册 页 ， 虽 然 你 可 能 会 发 现 自己 根本 不 需要 
对 它们 进行 处 理 。 
只 有 超级 用 户 才能 调用 setuid 和 setgid 函 数 。 
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46 主机 信息 


正如 程序 可 以 查找 用 户 信息 一 样 ， 程 序 也 可 以 获得 运行 它 的 计算 机 的 有 关 细 节 。uname 命 令 就 提 
供 这 类 信息 。 我 们 还 可 以 通过 同名 的 系统 调用 在 C 语 言 程序 中 提供 同样 的 信息 一 一 请 使 用 nan 2 uname 
命令 在 手册 页 的 系统 调用 部 分 〈 第 2 部 分 ) 查找 它 的 用 法 。 

主机 信息 在 许多 情况 下 都 是 很 有 用 的 。 你 可 能 希望 根据 程序 运行 的 机 器 在 网 络 上 的 名 字 来 定制 程 
序 的 行为 ， 比 如 说 ， 这 台 机 器 是 学 生 用 的 还 是 管理 员 用 的 。 从 许可 证 的 角度 考虑 ， 你 可 能 希望 限制 程 
序 只 能 在 一 台 机 器 上 运行 。 所 有 这 些 都 意味 着 你 需要 一 个 方法 来 确定 程序 运行 在 哪 台 机 器 上 。 

如 果 系 统 安装 了 网 络 组 件 ， 你 可 以 通过 gechostname 函 数 很 容易 地 获取 它 的 网 络 名 : 

#include <unistd.h> 





int gethostname(char *name, size t namelen); 

gethostname 函 数 把 机 器 的 网 络 名 写 入 name 字 符 串 。 该 字符 申 至 少 有 namelen 个 字符 长 。 成 功 时 ， 
gethostbyname 返 回 9， 否 则 返回 -1。 

你 可 以 通过 uname 系 统 调用 获得 关于 主机 的 更 多 详细 信息 : 


#include <sys/utsname.h> 


int uname(struct utsname *name); 


uname 函 数 把 主机 信息 写 入 name 参 数 指向 的 结构 。utsname 结 构 定义 在 头 文件 sys /utsname.h 中 ， 
它 至 少 包含 表 4-5 所 示 的 成 员 。 








表 45 
utename 成 员 Rm 
char sysname[] 操作 系统 名 
char nodename[] 主机 名 
char release[] 系统 发 行 级 别 
char version[] 系统 版 本 号 
char machine[] 硬件 类 型 


uname 在 成 功 时 返回 一 个 非 负 整数 ， 否 则 返回 -1 并 设置 errno 来 指出 错误 。 


实验 主机 信息 


下 面 的 程序 hostget .c 能 够 提取 出 一 些 主机 信息 : 


#include «sys/utsname.h» 
#include <unistd.h> 
#include <stdio.h> 
#include <stdlib.h> 


int main() 

t 
char computer [256]; 
struct utsname uts; 


if(gethostname(computer, 255) !- 0 || uname(&uts) < 0) ( 





fprintf(stderr, "Could not get host informationin*); 
exit(1); 
了 


printf(*Computer host name is %s\n", computer); 

printf(*System is %s on $s hardware\n", uts.sysname, uts.machine); 
printf(*Nodename is $s|n", uts.nodename); 

printf(*Version is $s, %s\n", uts.release, uts.version); 

exit(0); 





) 
它 给 出 如 下 所 示 的 Linux 特 有 的 输出 。 如 果 你 的 机 器 联网 了 ， 你 可 能 会 看 到 一 个 包含 网 络 名 在 内 
的 扩展 主机 名 。 


$ ./hostget 

Computer host name is susel03 

System is Linux on i686 hardware 

Nodename is susel03 

Version is 2.6.20.2-2-default, #1 SMP Fri Mar 9 21:54:10 UTC 2007 


实验 解析 
这 个 程序 调用 gethostname 来 获得 主机 的 网 络 名 。 在 上 面 的 例子 中 ， 它 获得 名 字 suse103。 有 关 
这 台 基 于 Intel Pentium-4 的 Linux 计 算 机 的 更 多 信息 通过 uname 调 用 返回 。 注意，uname 返 回 的 字符 串 的 
格式 是 与 具体 实现 相关 的 ， 在 本 例 中 ， 版 本 字符 串 包含 内 核 编译 的 日 期 。 
使 用 uname 浮 数 的 另外 一 个 例子 请 参看 uname 命 令 的 Linux 源 代码 。 
每 台 主机 的 唯一 标识 符 可 以 通过 gethostia 函 数 获得 : 


#include <unistd.h> 


long gethostid(void); 

gethostid 函 数 返回 与 主机 对 应 的 一 个 唯一 值 。 许 可 证 管理 者 利用 它 来 确保 软件 程序 只 能 在 拥有 
合法 许可 证 的 机 器 上 运行 。 在 Sun 工 作 站 上 ， 该 函数 返回 计算 机 生产 时 设置 在 非 易 失 性 存储 器 中 的 
个 数字 ， 它 对 系统 硬件 来 说 是 唯一 的 。 其 他 系统 ， 如 Linux， 返 回 一 个 基于 该 机 器 因特网 地 址 的 值 ， 
但 这 对 许可 证 管理 来 说 还 不 够 安全 。 





4.7 日 志 


许多 应 用 程序 需要 记录 它们 的 活动 。 系 统 程序 经 常 需要 向 控制 台 或 日 志文 件 写 消息 。 这 些 消息 可 
能 指示 错误 、 警 告 或 是 与 系统 状态 有 关 的 一 般 信 息 。 例 如 ，su 程 序 会 把 某 个 用 户 尝试 得 到 超级 用 户 权 
限 但 失败 的 事实 记录 下 来 。 

通常 这 些 日 志 信息 被 记录 在 系统 文件 中 ， 而 这 些 系统 文件 又 被 保存 在 专用 于 此 目的 的 目录 中 。 它 
可 能 是 /usryadm 或 /var/log 目 录 。 对 一 个 典型 的 Linux 安 装 来 说 , 文件 /var/1og/messages 包 含 所 有 
系统 信息 ，/var/1og/mail 包 含 来 自 邮件 系统 的 其 他 日 志 信息 ，/var/1o9/debug 可 能 包含 调试 信息 。 
根据 你 所 使 用 Linux 版 本 的 不 同 ， 可 以 通过 查看 /etc/syslog.conf 文 件 或 者 /etc/syslog-ng/sys- 
log-ng.conf 文 件 来 检查 系统 配置 。 

下 面 是 一 些 日 志 信息 的 示例 : 
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Mar 26 18:25:51 susel03 ifstatus: etho device: Advanced Micro Devices 
[AMD] 79c970 [PCnet32 LANCE] (rev 10) 
Mar 26 18:25:51 susel03 ifstatus: eth configuration: eth-id- 





:72 


May 20 06:56:56 suse103 SuSEfirewall2: Setting up rules from 
/etc/sysconfig/SuSEfirewall2 ... 

May 20 06:56:57 susel03 SuSEfirewall2: batch committing... 

May 20 06:56:57 susel03 SuSEfirewall2: Firewall rules successfully set 


Jun 9 09:11:14 suse103 su: (to root) neil on /dev/pts/18 09:50:35 

这 里 ， 你 可 以 看 到 记录 的 各 种 类 型 的 信息 。 前 几 个 是 由 Linux 内 核 在 启动 和 检测 已 安装 硬件 时 自己 
报告 的 信息 。 然 后 是 防火 墙 记录 它 重新 配置 的 信息 。 最 后 ，su 程 序 报告 用 户 neil 获得 了 超级 用 户 权限 。 

查看 日 志 信息 可 能 需要 有 超级 用 户 特权 。 

有 些 UNIX 系 统 并 不 像 上 面 这 样 提供 可 读 的 日 志文 件 ， 而 是 为 管理 员 提 供 一 些 工具 来 读 取 系统 事 
件 的 数据 库 。 具 体 情况 请 参考 系统 文档 。 

虽然 系统 消息 的 格式 和 存储 方式 不 尽 相同 , 但 产生 消息 的 方法 却 是 标准 的 .UNIX 规 范 通过 syslog 
函数 为 所 有 程序 产生 日 志 信息 提供 了 一 个 接口 


#include <syslog.h> 





void syslog(int priority, const char *message, arguments...); 

syslog 函 数 向 系统 的 日 志 设施 〈facility) 发 送 一 条 日 志 信息 。 每 条 信息 都 有 一 个 priority 参 数 ， 
该 参数 是 一 个 严重 级 别 与 一 个 设施 值 的 按 位 或 。 严 重 级 别 控制 日 志 信 息 的 处 理 方式 ， 设 施 值 记录 日 志 
信息 的 来 源 。 

定义 在 头 文件 syslog.h 中 的 设施 值 包括 Loc_UszR (默认 值 ) 一 一 它 指出 消息 来 自 一 个 用 户 应 用 








程序 ， 以 及 LoG_LocAL0、LoG_LocaL1 直 到 Loc_LocaL7， 它 们 的 含义 由 本 地 管理 员 指定 。 
严重 级 别 按 优先 级 递减 排列 ， 如 表 4-6 所 示 。 
表 4-6 
一 er 
LOG EMERG 紧急 情况 
LOG_ALERT 高 优先 级 故障 ， 例 如 数据 库 删 省 
LoG_CRIT 严重 错误 ， 例 如 硬件 故障 
LOG_ERR 错误 
LOG_WARNING Lol 
LOG. NOTICE 需要 注意 的 特殊 情况 
LOG INFO 一 般 信息 
LG. DEBUG 调试 信息 





根据 系统 配置 , LoG_EMERG 信 息 可 能 会 广播 给 所 有 用 户 , LoG_ALERT 信 息 可 能 会 EMAIL 给 管理 员 ， 
LOG_DEBUG 信 息 可 能 会 被 忽略 , 而 其 他 信息 则 写 入 日 志文 件 。 当 编写 的 程序 需要 使 用 日 志 记 录 功 能 时 ， 
你 只 需要 在 希望 创建 日 志 信息 时 调用 syslog 函 数 即 可 。 

syslog 创 建 的 日 志 信息 包含 消息 头 和 消息 体 。 消息 头 根据 设施 值 及 日 期 和 时 间 创建 。 消息 体 根据 
syslog 的 message 参 数 创建 ， 该 参数 的 作用 类 似 printf 中 的 格式 字符 串 。sysiog 的 其 他 参数 要 根据 
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message 字 符 串 中 printf 风 格 的 转换 控制 符 而 定 。 此 外 ， 转 换 控制 符 sm 可 用 于 插入 与 错误 变量 errno 
当前 值 对 应 的 出 错 消息 字符 串 。 这 对 于 记录 错误 消息 很 用。 


GE 验 sayslog 函 数 
在 这 个 程序 中 ， 你 试图 打开 一 个 不 存在 的 文件 : 





#include «syslog.h» 
#include <stdio.h> 
#include <stdlib.h> 


int main() 
( 
FILE *f; 


f = fopen("not here',*r*); 
if(!f) 
syslog (LOG_ERR |LOG_USER, "oops - tmWn*); 
exit(0); 
) 


编译 并 运行 这 个 程序 syslog.c， 你 没有 看 到 输出 ， 但 是 /var/1og/messages 文 件 尾 现在 有 如 下 
s 
Jun 9 09:24:50 susel03 syslog: oops - No such file or directory 
实验 解析 
在 这 个 程序 中 ， 你 试图 打开 一 个 不 存在 的 文件 。 在 文件 打开 失败 后 ， 调 用 syslog 在 系统 日 志 中 记 
录 这 一 事件 。 





注意 : 并 未 指明 是 哪个 程序 调用 了 日 志 设 施 , 它 仅仅 记录 syslog 被 调用 以 记录 一 条 信息 
的 事实 。sm 转 换 控制 符 被 替换 为 一 个 错误 描述 ， 在 本 例 中 就 是 “文件 没有 找到 "。 这 比 仅仅 报告 一 个 
原始 的 错误 码 更 有 用 。 


在 头 文件 syslog .h 中 还 定义 了 一 些 能 够 改变 日 志 记录 行为 的 其 他 函数 。 它 们 是 : 


finclude «syslog.h» 


void closelog(void); 
void openlog(const char *ident, int logopt, int facility); 
int setlogmask(int maskpri); 


你 可 以 通过 调用 openlog 函 数 来 改变 日 志 信息 的 表示 方式 。 它 可 以 设置 一 个 字符 串 idaent， 该 字 

符 串 会 添加 在 日 志 信息 的 前 面 。 你 可 以 通过 它 来 指明 是 哪个 程序 创建 了 这 条 信息 。facility 参 数 记录 

-个 将 被 用 于 后 续 syslog 调 用 的 默认 设施 值 ， 其 默认 值 是 LOG_USER。1ogopt 参 数 对 后 续 syslog 调 用 
的 行为 进行 配置 ， 它 是 0 个 或 多 个 表 4-7 中 参数 的 按 位 或 。 








R 4-7 
logopt 参 数 说 0m 
LoG-PID 在 日 志 信息 中 包含 进程 标识 符 ， 这 是 系统 分 配给 每 个 进程 的 一 个 唯一 值 
LOG. CONS 如 果 信 息 不 能 被 记录 到 日 志文 件 中 ， 就 把 它们 发 送 到 控制 台 
LOG. ODELAY 在 第 一 次 调用 syslog 时 才 打开 日 志 设 施 


LOG NDELAY 立即 打开 日 志 设施 ， 而 不 是 等 到 第 一 次 记录 日 志 时 
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openlog 函 数 会 分 配 并 打开 一 个 文件 描述 符 ， 并 通过 它 来 写 日 志 。 你 可 以 调用 closelog 函 数 来 关 
HÈ. 注意， 在 调用 syslog 之 前 无 需 调 用 openlog， 因 为 syslog 会 根据 需要 自行 打开 日 志 设施 。 

你 可 以 使 用 setlogmask 函 数 来 设置 一 个 日 志 掩 码 ， 并 通过 它 来 控制 日 志 信息 的 优先 级 。 优 先 级 
未 在 日 志 掩 码 中 置 位 的 后 续 syslog 调 用 都 将 被 丢弃 。 所 以 你 可 以 通过 这 个 方法 关闭 LoG_DEBUG 消 息 而 
不 用 改变 程序 主体 。 

你 可 以 用 LOG_MASK (priority) 为 日 志 信息 创建 一 个 掩 码 ， 它 的 作用 是 创建 一 个 只 包含 一 个 优先 
级 的 掩 码 。 你 还 可 以 用 LOG_UPro (priority) 来 创建 一 个 由 指定 优先 级 之 上 的 所 有 优先 级 〈 包 括 指定 
优先 级 ) 构成 的 掩 码 。 


实验 | logmask 程 序 


在 本 例 中 ， 你 将 看 到 日 志 掩 码 的 作用 : 


#include <syslog.h> 
#include <stdio.h> 
#include «unistd.h» 
#include «stdlib.h» 








int main() 
t 
int logmask; 


openlog(*logmask*, LOG PID|LOG CONS, LOG USER); 
syslog (LOG_INFO, "informative message, pid = %d", getpid()); 
syslog(LOG DEBUG,"debug message, should appear"); 
logmask = setlogmask(LOG, UPTO (LOG. NOTICE)); 
syslog (LOG_DEBUG, "debug message, should not appear"); 
exit(0); 

) 


这 个 logmask.c 程 序 没有 输出 ， 但 是 在 一 个 典型 的 Linux 系 统 中 ， 在 /var/1log/messages 文 件 尾 ， 
你 会 看 到 如 下 信 





8:52 susel03 logmask[19339]: informative message, pid = 19339 

接收 调试 日 志 信息 的 文件 《根据 日 志 配 置 而 定 ， 通 常 是 /var/log/aebug， 有 时 也 可 能 是 
/var/log/messages) 会 包含 如 下 信息 : 

Jun 9 09:28:52 susel03 logmask[19339]: debug message, should appear 

这 个 程序 用 它 自己 的 名 字 1ogmask 初 始 化 日 志 设施 ， 并 要 求 日 志 信息 中 包含 进程 标识 符 。 一 般 信 
息 记录 到 文件 /var/1og/messages 中 ， 调 试 信息 记录 到 文件 /var/1og/Gebug 中 。 第 二 条 调试 信息 没 
有 出 现 ， 这 是 因为 你 调用 setlogmask 忽 略 了 优先 级 低 于 LOG_NOTICE 的 所 有 信息 (注意 ， 这 种 做 法 在 
早期 Linux 内 核 中 可 能 不 支持 )。 

如 果 你 的 Linux 安 装 没有 启用 调试 信息 日 志 记录 功能 ， 或 者 采用 的 是 其 他 配置 情况 ， 你 可 能 看 不 
到 调试 信息 。 要 启用 所 有 的 调试 信息 ， 请 查看 系统 中 针对 syslog 或 sys1log-ng 的 文档 以 找到 正确 的 配 
置 方法 。 
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logmasx.c 还 用 到 了 getpia 函 数 ， 它 和 与 其 紧密 相关 的 gerppid 函 数 的 定义 如 下 所 示 : 

#include <sys/types.h> 

finclude <unistd.h> 

pid t getpid(void); 

pid t getppid(void); 

这 两 个 函数 分 别 返 回调 用 进程 和 调用 进程 的 父 进程 的 进程 标识 符 (PID)。 要 了 解 PID 的 更 多 内 容 ， 
请 参考 第 11 章 的 内 容 。 





4.8 资源 和 限制 


Linux 系 统 上 运行 的 程序 会 受到 资源 限制 的 影响 。 它们 可 能 是 硬件 方面 的 物理 性 限制 (例如 内 存 )、 
系统 策略 的 限制 〈 例 如， 允许 使 用 的 CPU 时 间 ) 或 具体 实现 的 限制 (如 整数 的 长 度 或 文件 名 中 所 允许 
的 最 大 字符 数 )。UNIX 规 范 定义 了 一 些 可 由 应 用 程序 决定 的 限制 。 第 7 章 对 限制 及 突破 限制 的 后 果 做 
了 进一步 讨论 。 











头 文件 limits.h 中 定义 了 许多 代表 操作 系统 方面 限制 的 显 式 常量 ， 如 表 4-8 所 示 。 
表 4-8 
限制 常量 含 x 
RM ME 文件 名 中 的 最 大 字符 数 
CHAR_BIT char 类 型 值 的 位 数 
CHAR. MAX char 类 型 的 最 大 值 
INT. MAX int 类 型 的 最 大 值 





还 有 许多 其 他 对 应 用 程序 有 用 的 限制 ， 请 参考 你 自己 系统 中 的 头 文件 。 
注意 : NAME_MAX 是 特定 于 文件 系统 的 。 为 了 写 可 移植 性 更 好 的 代码 ， 你 应 该 使 用 
pathconf 函 数 。 详细 信息 请 参考 pathconf 的 手册 页 。 


头 文件 sys/resource.h 提 供 了 资源 操作 方面 的 定义 ， 其 中 包括 对 程序 长 度 、 执 行 优先 级 和 文件 
资源 等 方面 限制 进行 查询 和 设置 的 函数 : 

#include «sys/resource.h» 

int getpriority(int which, id t who); 

int setpriority(int which, id t who, int priority); 

int getrlimit(int resource, struct rlimit *r limit); 


int setrlimit(int resource, const struct rlimit *r limit); 
int getrusage(int who, struct rusage *r usage); 


id_t 是 一 个 整数 类 型 ， 它 用 于 用 户 和 组 标识 符 。 在 头 文件 sys/resource.h 中 定义 的 rusage 结 构 
用 来 确定 当前 程序 已 耗费 了 多 少 CPU 时 间 ， 它 至 少 包 含 表 4-9 所 示 的 两 个 成 员 。 
R 4-9 
rusage 成 员 LER] 
struct timeval ru utime 使 用 的 用 户 时 间 
struct timeval ru stime 使 用 的 系统 时 间 
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timeval 结 构 定义 在 头 文件 sys/time.h 中 ， 它 包含 成 员 tv_sec 和 tv_usec， 分 别 代表 秒 和 微 秒 。 

一 个 程序 耗费 的 CPU 时 间 可 分 为 用 户 时 间 (程序 执行 自身 的 指令 所 耗费 的 时 间 ) 和 系统 时 间 ( 操 
作 系 统 为 程序 执行 所 耗费 的 时 间 ， 即 执行 输入 输出 操作 的 系统 调用 或 其 他 系统 函数 所 花费 的 时 间 )。 

getrusage 函 数 将 CPU 时 间 信 息 写 入 参数 r_usage 指 向 的 rusage 结 构 中 。 参 数 who 可 以 是 表 4-10 
所 示 的 常量 之 一 。 








表 4-10 
who 常 量 说 m 
RUSAGE SELF 仅 返回 当前 程序 的 使 用 信息 
RUSAGE_CHILDREN 还 包括 子 进程 的 使 用 信息 





我 们 将 在 第 11 章 讨论 子 进程 和 任务 优先 级 ， 但 考虑 到 完整 性 ， 我 们 将 在 这 里 简单 介绍 它们 对 系统 
资源 的 影响 。 就 现在 而 言 ， 了 解 下 面 一 点 就 够 了 ， 每 个 运行 的 程序 都 有 一 个 与 之 关联 的 优先 级 ， 优先 
级 越 高 的 程序 将 分 配 到 更 多 的 CPU 可 用 时 间 。 

普通 用 户 只 能 降低 其 程序 的 优先 级 ， 而 不 能 升 高 

应 用 程序 可 以 用 getpriority 和 setpriority 函 数 确定 和 更 改 它们 〈 和 其 他 程序 ) 的 优先 级 。 被 
优先 级 函数 检查 或 更 改 的 进程 可 以 用 进程 标识 符 、 组 标识 符 或 用 户 来 确定 。which 参 数 指定 了 对 待 who 
参数 的 方式 ， 如 表 4-11 所 示 。 








表 4-11 
—— a a 
PRIO PROCESS who 参 数 是 进程 标识 符 
PRIO PORP who 参 数 是 进程 组 
PRIO_USER who 参 数 是 用 户 标识 符 


因此 ， 为 确定 当前 进程 的 优先 级 ， 你 可 以 调用 : 

priority = getpriority(PRIO PROCESS, getpid()); 

setpriority 函 数 用 于 设置 一 个 新 的 优先 级 〔 如 果 可 能 的 话 )。 

默认 的 优先 级 是 0。 正 数 优先 级 用 于 后 台 任务 ， 它们 只 在 没有 其 他 更 高 优先 级 的 任务 准备 运行 时 
才 执行 。 负 数 优先 级 使 一 个 程序 运行 更 频繁 , 获得 更 多 的 CPU 可 用 时 间 。 优先 级 的 有 效 范 围 是 -20~,20。 
这 很 容易 让 人 困惑 ， 因 为 数值 越 高 ， 执 行 优先 级 反而 越 低 。 

getpriority 在 成 功 时 返回 一 个 有 效 的 优先 级 ， 失 败 时 返回 -1 并 设置 errno 变 量 。 因 为 -1 本 身 是 
一 个 有 效 的 优先 级 ， 所 以 在 调用 getpriority 之 前 应 将 errno 设 置 为 0， 并 在 函数 返回 时 检查 它 是 否 仍 
为 0。setpriority 在 成 功 返回 0， 吾 则 返回 -1。 

系统 资源 方面 的 限制 可 以 通过 getrlimit 和 setrlimit 来 读 取 和 设置 。 这 两 个 函数 都 利用 一 个 通 
用 结构 rlimit 来 描述 资源 限制 。 该 结构 定义 在 头 文件 sys/resource.h 中 ， 它 包含 表 4-12 所 示 的 成 员 。 


表 4-12 


rlimit 成 员 说 明 
rlimt rlim cur 当前 的 软 限 制 
rlim t rlim max 硬 限制 











4.8 资源 和 限制 141 





类 型 rlim_t 是 一 个 整数 类 型 ， 它 用 来 描述 资源 级 别 。 一 般 来 说 ， 软 限制 是 一 个 建议 性 的 最 好 不 要 
超越 的 限制 ， 如 果 超 越 可 能 会 导致 库 函数 返回 错误 。 硬 限制 如 果 被 超越 ， 则 可 能 会 导致 系统 通过 发 送 
信号 的 方式 来 终止 程序 的 运行 。 例 如 ， 当 CPU 时 间 限 制 被 超越 时 系统 会 发 送 sSIGxcPU 信 号 ， 数 据 长 度 
限制 被 超越 时 系统 会 发 送 sIGsEGV 信 号 。 程 序 可 以 把 自己 的 软 限制 设置 为 小 于 硬 限制 的 任何 值 。 它 也 
可 以 减 小 自己 的 硬 限 制 。 但 只 有 以 超级 用 户 权 限 运行 的 程序 才能 增加 硬 限制 。 

有 许多 系统 资源 可 以 进行 限制 ， 它 们 由 rlimit 函 数 中 的 resource 参 数 指定 ， 并 在 头 文件 
sys/resource.h 中 定义 ， 如 表 4-13 所 示 。 








表 4-13 
reaource 参 数 w 明 
RLIMIT_CORE 内 核 转 储 〈core dump) 文件 的 大 小 限制 (以 字 节 为 单位 ) 
RLIMIT CPU CPU 时 间 限 制 〔 以 秒 为 单位 ) 
RLIMIT_DATA 数据 段 限制 (以 字 节 为 单位 ) 
RLIMIT_FSIZE 文件 大 小 限制 以 字 节 为 单位 ) 
RLIMIT NOFILE 可 以 打开 的 文件 数 限制 
RLIMIT STACK 栈 大 小 限制 (以 字 节 为 单位 》 
RLIMIT_AS 地 址 空间 ( 栈 和 数据 ) 限制 〔 以 字 节 为 单位 ) 


下 面 的 实验 给 出 了 一 个 程序 limits.c, 它 模拟 一 个 典型 的 应 用 程序 。 该 程序 设置 并 超越 了 一 个 次 
源 限制 。 

FETU 

(1) 首先 ， 把 你 在 程序 中 要 用 到 的 所 有 函数 对 应 的 头 文件 包含 进来 : 

#include <sys/types.h> 

#include <sys/resource.h> 

#include «sys/time.h» 

#include <unistd.h> 

#include <stdio,h> 


#include «stdlib.h» 
#include «math.h» 


(2) void work O 函数 将 一 个 字符 串 写 入 一 个 临时 文件 10 000 次 ， 然 后 做 一 些 算术 运算 以 产生 CPU 
负载: 


void work() 
t 





FILE *f; 
int i; 
double x = 4.5; 


f = tmpfile(); 
for(i = 0; i < 10000; i++) { 
fprintf(f,'Do some outputin*); 
if(ferror(f)) ( 
fprintf (stderr, "Error writing to temporary file\n"); 
exit(1); 
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) 
for(i = 0; i < 1000000; i++) 
x = log(x*x + 3.21); 
} 
G) main 函 数 调用 work 函 数 ， 然 后 用 getrusage 函 数 来 发 现 它 耗费 的 CPU 时 间 ， 并 把 该 信息 显示 
在 屏幕 上 : 
int main() 
t 
Struct rusage r usage; 
struct rlimit r limit; 
int priority; 


work(); 
getrusage(RUSAGE SELF, &r usage); 


Pprintf(*CPU usage: User = $1d.$061d, System = %1d.%061d\n", 
r.usage.ru utime.tv sec, r usage.ru, utime.tv usec, 
r.usage.ru stime.tv sec, r usage.ru stime.tv usec); 


(4) 接着 ，main 函 数 分 别 调用 getpriority 和 getrlimit 来 发 现 它 的 当前 优先 级 和 文件 大 小 限制 : 


priority = getpriority(PRIO PROCESS, getpid()); 
printf(*Current priority = &dWn', priority); 


getrlimit(RLIMIT FSIZE, &r limit); 
printf("Current FSIZE limit: soft = $ld, hard = $ldWn*, 
rlimit.rlim cur, r limit.rlim max); 


(5) 最 后 ， 我 们 用 setrlimit 设 置 文件 大 小 限制 并 再 次 调用 work， 这 次 work 函 数 的 执行 会 失败 ， 
因为 它 试图 创建 一 个 太 大 的 文件 : 
r_limit.rlim cur = 2048; 
r_limit.rlim max = 4096; 
printf ("Setting a 2K file size limitin*); 
setrlimit(RLIMIT FSIZE, &r limit); 


work(); 
exit(0); 
) 
当 运 行 这 个 程序 时 ， 你 可 以 看 到 消耗 的 CPU 资源 有 多 少 以 及 程序 运行 的 默认 优先 级 。 一 旦 设置 了 
文件 大 小 限制 ， 程 序 就 不 能 往 临时 文件 里 写 入 多 于 2 048 个 字 节 了 。 
$ cc -o limits limits.c -lm 
$ ./limits 
CPU usage: User = 0.140008, System = 0.020001 
Current priority - 0 
Current FSIZE limit: soft - -1, hard - -1 
Setting a 2K file size limit 
File size limit exceeded 


你 可 以 用 nice 命 令 启 动 程序 来 改变 程序 的 优先 级 。 这 里 ， 你 看 到 程序 的 优先 级 变 成 了 +10。 因 此 ， 
程序 的 执行 时 间 变 长 了 。 
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$ nice ./limits 
CPU usage: User = 0.152009, System = 0.020001 
Current priority - 10 

Current FSIZE limit: soft = -1, hard = -1 
Setting a 2K file size limit 

File size limit exceeded 


limics 程 序 通过 调用 work 函 数 来 模拟 一 个 典型 程序 的 行为 。 它 执行 一 些 运算 并 产生 一 些 输出 ， 
在 本 例 中 , 它 输 出 大 约 150K 字 节 的 数据 到 临时 文件 它 调用 资源 函数 来 发 现 其 优先 级 和 文件 大 小 限制 。 
在 本 例 中 ， 文 件 大 小 限制 未 设置 ， 所 以 你 想 创建 多 大 的 文件 就 可 以 创建 多 大 的 文件 (只 要 磁盘 空间 多 
许 )。 随 后 ， 程 序 设置 它 的 文件 大 小 限制 为 2K 并 再 次 执行 一 些 工 作 。 此 时 ，work 函 数 的 调用 失败 了 ， 
因为 它 不 能 创建 太 大 的 临时 文件 。 
你 也 可 以 通过 bash 的 ul imit 命 令 为 在 某 一 特定 shell 中 运行 的 程序 设置 限制 。 


在 本 例 中 ， 出 错 信息 Error writing to temporary file( 写 临时 文件 出 错 ) 可 能 不 会 像 你 期 
望 的 那样 打印 出 来 。 这 是 因为 当 资 源 限制 被 超越 时 ， 一 些 系统 〔 如 Linux 2.2 和 后 续 版 本 ) 会 通过 发 送 
信号 sIGxFsz 的 方式 来 终止 程序 。 你 将 在 第 11 章 学 习 有 关 信 号 及 其 使 用 的 更 多 知识 。 其 他 一 些 POSIX 
兼容 的 系统 可 能 只 是 让 资源 限制 被 超越 的 函数 返回 一 个 错误 。 





4.9 小 结 


在 本 章 中 ， 你 了 解 了 Linux 环 境 ， 并 对 程序 运行 的 条 件 进行 了 研究 。 你 学 习 了 命令 行 参数 和 环境 
变量 ， 它 们 都 能 用 来 改变 程序 的 默认 行为 ， 并 提供 有 用 的 程序 选项 。 
还 看 到 程序 怎样 利用 库 函 数 来 处 理 日 期 和 时 间 值 ， 获 得 自身 、 用 户 及 它 运行 之 上 的 计算 机 的 相 
关 信 息 。 

因为 Linux 程 序 通常 都 要 共享 主机 上 的 宝贵 资源 ， 所 以 本 章 也 对 如 何 确定 和 管理 资源 的 问题 做 了 
介绍 。 
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本 章 中 , 你 将 看 到 如 何 完善 第 2 章 中 的 基本 应 用 程序 。 该 程序 最 明显 的 不 足 就 是 其 用 户 界面 ， 
E 虽然 它 实现 了 所 需 功 能 ， 但 并 不 好 用 。 在 本 章 中 ， 你 将 学 习 如 何 更 好 的 控制 用 户 终端 ， 包 
括 控制 键盘 输入 及 屏幕 输出 。 不 仅 如 此 , 你 还 将 学 习 如 何 保证 编写 的 程序 能 够 从 用 户 那里 获取 输入 ( 即 
使 用 户 对 程序 使 用 了 输入 重 定向 )， 以 及 确保 程序 的 输出 显示 在 屏幕 的 正确 位 置 上 。 
虽然 ， 重 新 实现 CD 数据 库 应 用 程序 的 构想 只 有 到 第 7 章 的 结束 才能 见 到 曙光 ， 但 你 将 在 本 章 为 第 
7 章 做 大 量 的 底层 准备 工作 。 第 6 章 是 基于 curses 的 ， 但 它 并 不 是 古老 的 咒语 "， 而 是 一 个 函数 库 ， 它 
提供 了 控制 终端 屏幕 显示 的 高 级 代码 。 同 时 ， 我 们 还 将 通过 介绍 一 些 Linux 和 UNIX 的 哲学 思想 以 及 终 
端 输 入 和 输出 的 概念 来 兽 明 早期 UNIX 社 团 成 员 的 想法 。 也 许 ， 我 们 在 这 里 给 出 的 底层 访问 方 刀 
您 正在 寻找 的 。 我 们 将 在 这 里 介绍 的 绝 大 部 分 内 容 同样 适用 于 运行 在 终端 窗口 中 的 程序 ， 如 运 
KDE 的 Kconsole、GNOME 的 gnome-terminal 或 者 是 标准 X11 的 xterm 中 的 程序 。 
在 本 章 中 ， 你 将 学 习 以 下 内 容 : 
口 对 终端 进行 读 写 
O 终端 驱动 程序 和 通用 终端 接口 
U termios 
O 终端 的 输出 和 cerminfo 
口 检测 键盘 击 键 动作 


5.1 对 终端 进行 读 写 

在 第 3 章 中 ， 你 了 解 到 当 一 个 程序 在 命令 提示 符 中 被 调用 时 ，shell 负 责 将 标准 输入 和 标准 输出 流 
连接 到 你 的 程序 。 通 过 在 程序 中 使 用 getchar 和 printf 函 数 , 你 可 以 很 容易 地 对 这 些 默 认 流 进行 读 写 ， 
实现 程序 和 用 户 之 间 的 交互 。 

在 下 面 的 实验 中 ， 你 将 使 用 上 面 提 到 的 两 个 函数 getchar 和 printf 重 写 菜 单 例 程 ， 新 程序 的 文件 
名 为 menul .c。 
i | ACREA BOCA li 


(1) 程序 开始 部 分 的 语句 定义 了 一 个 用 来 显示 菜单 内 容 的 字符 数组 和 getchoice 函 数 的 原型 : 


#include «stdio.h» 
#include «stdlib.h» 


















名 英文 单词 curse 是 咒语 的 意思 。 一 一 译 者 注 
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char *menu[] = ( 
"a - add new record" 
"d - delete record' 
"q - qit", 
NULL, 





int getchoice(char *greet, char *choices[]); 


(2) main 函 数 以 刚才 定义 的 样本 菜单 字符 数组 menu 为 参数 调用 getchoice 函 数 : 


int main() 
int choice = 0; 


do 

€ 
choice = getchoice("Please select an action*, menu); 
printf(*You have chosen: $cin*, choice]; 

) while(choice != 'q'); 

exit(0); 


Q) 下 面 是 这 个 程序 的 核心 代码 : 负责 显示 菜单 及 读 取 用 户 输入 的 函数 gecchoices 
int getchoice(char *greet, char *choices[]) 
int chosen = 


int selected, 
char **option; 





do ( 
printf("Choice: $sYn",greet); 
option = choices; 
while(*option) ( 
printf("*$sWn*,*option); 
optione; 


selected = getchar(); 
option = choices; 
while(*option) ( 
if(selected == *option[0]) { 
chosen = 1; 
break; 
) 
optione*; 
) 
if(!chosen) ( 
printf(*Incorrect choice, select againWn*); 
) 
) while(!chosen); 
return selected; 
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实验 解析 

getchoice 函 数 显示 程序 的 介绍 信息 greet 和 样本 菜单 choices, 并 要 求 用 户 输入 代表 某 个 菜单 选 
项 的 首 字符 。 接 下 来 ， 程 序 进入 循环 ， 直 到 getchar 函 数 返回 与 option 字 符 数 组 中 某 个 数组 成 员 的 首 
字母 匹配 的 字符 为 止 。 

编译 并 运行 这 个 程序 ， 你 会 发 现 它 并 没有 像 你 所 期 望 的 那样 工作 。 下 面 的 例子 说 明了 这 一 问题 : 

$ ./menul 

Choice: Please select an action 

a - add new record 

d - delete record 

q- quit 

a 

You have chosen: a 

Choice: Please select an action 

a - add new record 

d - delete record 

q- quit 

Incorrect choice, select again 

Choice: Please select an action 

a - add new record 

d - delete record 

q- quit 

a 

You have chosen: q 

E 


用 户 必须 要 输入 “A/ 回 车 /Q/ 回 车 ”等 才能 做 出 选择 。 从 上 面 的 例子 中 可 以 看 出 ， 这 个 程序 至 少 
有 两 个 问题 .最 严重 的 问题 是 ,每 当 你 做 出 正确 的 选择 后 ,屏幕 上 都 会 出 现 错误 提示 Incorrect choice, 
select again (错误 的 选择 ， 请 重新 选择 )。 另 一 个 问题 是 ， 只 有 在 按 下 回 车 键 后 程序 才 会 读 取 输入 。 








1. 标准 模式 和 非 标 准 模式 

这 两 个 问题 是 紧密 相关 的 。 默 认 情况 下 ， 只 有 在 用 户 按 下 回 车 键 后 ， 程 序 才能 读 到 终端 的 输入 。 
在 大 多 数 情况 下 ， 这 样 做 是 有 益 的 ， 因 为 它 允 许 用 户 使 用 退 格 键 〈Backspace) 或 删除 键 (Delete) 来 
纠正 输入 中 的 错误 ， 用 户 只 在 对 自己 在 屏幕 上 看 到 的 内 容 满意 时 ， 才 会 按 下 回 车 键 把 键入 的 数据 传递 
给 程序 。 

这 种 处 理 方式 被 称 为 规范 模式 (canonical mode) 或 标准 模式 (standard mode)。 所 有 的 输入 都 基 
于 行进 行 处 理 ， 在 一 个 输入 行 完 成 前 〈 通 常 是 用 户 按 下 回 车 键 之 前 )， 终 端 接口 负责 管理 所 有 的 键盘 
输入 ， 包 括 退 格 键 ， 应 用 程序 读 不 到 用 户 输入 的 任何 字符 。 

与 标准 模式 相对 的 是 非 标准 模式 Cnon-canonical mode)， 在 这 种 模式 中 ， 应 用 程序 对 用 户 输入 字 
符 的 处 理 拥有 更 大 的 控制 权 。 我 们 稍 后 会 再 回 到 这 两 种 模式 上 来 。 

除 此 之 外 ，Linux 终 端 处 理 程序 能 够 把 中 断 字符 转换 为 对 应 的 信号 (例如 ， 按 下 Ctrl+C 可 以 中 断 程 
Ho. 从 而 自动 替 用 户 完成 对 退 格 键 和 删除 键 的 处 理 ， 用 户 无 需 在 自己 编写 的 每 个 程序 中 重新 实现 它 。 
我 们 将 在 第 11 章 详细 介绍 信号 。 

那么 ， 这 个 程序 的 问题 究竟 在 哪里 呢 ? 是 这 样 的 ，Linux 会 暂 存 用 户 输入 的 内 容 ， 直 到 用 户 按 下 
回 车 键 ， 然 后 将 用 户 选择 的 字符 及 紧 随 其 后 的 回 车 符 一 起 传递 给 程序 。 所 以 ， 每 当 你 输入 一 个 菜单 选 
择 时 ， 程 序 就 调用 getchar 函 数 处 理 该 字符 ， 而 当 程 序 在 下 一 次 循环 中 再 次 调用 getchar 函 数 时 ， 它 
会 立刻 返回 一 个 回 车 符 。 
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程序 真正 看 到 的 字符 并 不 是 ASCII 码 的 回 车 符 cR 十进制 表示 为 13, 十 六 进 制 表示 为 0D), 而 是 换 
行 符 LF 〈 十 进 制 表示 为 10， 十 六 进 制 表示 为 0A)。 这 是 因为 ，Linux 同 UNIX 系 统一 样 ， 在 其 内 部 都 是 
以 换行 符 作为 文本 行 的 结束 。 也 就 是 说 ，UNIX 用 一 个 单独 的 换行 符 来 表示 一 行 的 结束 ， 而 其 他 的 操 
作 系统 〈 如 MS-DOS) 用 回 车 符 和 换行 符 两 个 字符 的 结合 来 表示 一 行 的 结束 。 如 果 输 入 或 输出 设备 本 
身 需 要 发 送 或 接收 一 个 回 车 符 , 则 由 Linux 终 端 处 理 程序 负责 完成 它 。 如 果 你 已 经 习惯 MS-DOS 或 其 他 
操作 系统 的 环境 ， 你 可 能 会 对 Linux 的 这 种 做 法 感到 有 一 些 奇怪 。 但 这 样 做 的 最 大 好 处 是 ， 它 使 得 在 
Linux 系 统 中 ， 文 本 文件 和 二 进 制 文 件 无 任何 实际 的 区 别 。 只 有 在 对 终端 、 某 些 打印 机 或 绘图 仪 进行 
输入 输出 时 ， 你 才 需 要 对 回 车 符 进行 处 理 。 

在 下 面 的 代码 中 ， 通 过 忽略 额外 的 换行 符 来 纠正 菜单 例 程 中 的 主要 错误 ， 

do ( 


selected = getchar(); 
) while(selected == '\n'); 


它 解 决 了 燃眉之急 ， 你 将 看 到 如 下 所 示 的 输出 
$ ./menul 

Choice: Please select an action 

a - add new record 

d - delete record 

a- quit 

a 

You have chosen: a 

Choice: Please select an action 


a - add new record 
d - delete record 
q- quit 

a 

You have chosen: q 


$ 

我 们 将 在 本 章 的 后 面 针对 这 个 程序 的 第 二 个 问题 “必须 按 下 回 车 键 才能 让 程序 继续 执行 ” 给 出 
-个 更 加 精巧 的 解决 方案 。 

2. 处 理 重 定向 输出 

Linux 程 序 ， 甚 至 是 交互 式 的 Linux 程 序 ， 经 常会 把 它们 的 输入 或 输出 重 定向 到 文件 或 其 他 程序 。 

我 们 来 看 看 把 程序 的 输出 重 定向 到 一 个 文件 时 出 现 的 情况 : 
$ ./menul » file 
a 


a 
$ 


你 可 以 把 这 种 处 理 方式 看 作 是 成 功 的 ， 因 为 程序 的 输出 确实 被 重 定向 到 文件 ， 而 不 是 显示 在 终端 
上 。 但 有 时 你 并 不 想 这 么 做 ， 或 者 你 希望 对 准备 让 用 户 看 到 的 提示 信息 与 其 他 输出 进行 区 别 对 待 ， 前 
者 仍然 输出 到 终端 上 ， 而 后 者 可 以 被 安全 地 重 定向 。 

如 果 想 知道 标准 输出 是 否 被 重 定向 了 ， 只 需 检查 底层 文件 描述 符 是 否 关联 到 一 个 终端 即 可 。 系 统 
调用 isatty 就 是 用 来 完成 这 一 任务 的 。 你 只 需 将 有 效 的 文件 描述 符 传递 给 它 ， 它 就 可 判断 出 该 描述 符 
是 否 连接 到 一 个 终端 。 

#include <unistd.h> 











int isatty(int fd); 
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如 果 打开 的 文件 描述 符 fa 连 接 到 一 个 终端 ， 则 系统 调用 isatty 返 回 1， 否 则 返回 0。 

在 这 个 程序 中 , 你 使 用 的 是 文件 流 , 但 isacty 只 能 对 文件 描述 符 进行 操作 。 为 了 提供 必要 的 转换 ， 
你 需要 把 isatty 调 用 与 在 第 3 章 中 介绍 的 fileno 函 数 结合 使 用 。 
如 果 stdout〔 标 准 输 出 ) 已 被 重 定向 ， 你 该 做 什么 呢 ? 直接 退出 不 是 一 个 好 办 法 ， 因 为 用 户 无 法 
知道 程序 为 什么 会 运行 失败 。 向 scaout 输 出 一 条 消息 也 不 起 作用 ， 因 为 这 条 消息 也 会 被 重 定向 。 一 种 
解决 方法 是 将 消息 写 到 staerr (标准 错误 输出 )， 它 不 会 被 shell 的 >file 命 令 重 定向 。 


Eg 检查 是 否 存在 输出 重 定向 


沿用 上 面 实验 中 创建 的 menul .c 程 序 ， 在 其 中 加 上 新 的 include 语 句 ， 对 main 函 数 进行 如 下 的 修 
改 ， 并 重新 将 该 程序 命名 为 nenu2.c。 


#include <unistd.h> 
int main() 
{ 

int choice = 0; 


if(!isatty(fileno(stdout))) ( 
fprintf (stderr, "You are not a terminal!|n*); 
exit(1); 

) 

do ( 
Choice = getchoice("Please select an action" 
printf(*You have chosen: gc\n", choice); 

) while(choice != 'q'); 

exit(0); 

) 


请 看 这 个 程序 给 出 的 样本 输出 : 
$ ./menu2 

Choice: Please select an action 
a - add new record 

d - delete record 

q - quit 

a 

You have chosen: q 

$ menu2 > file 

You are not a terminal! 

$ 


新 代码 段 用 isatty 函 数 来 测试 标准 输出 是 否 已 连接 到 一 个 终端 ， 如 果 没 有 ， 则 退出 程序 。shell 
也 用 同一 种 技术 来 判断 是 否 需 要 提供 终端 提示 符 。 将 stGout 和 stderr 同 时 重 定 向 也 是 可 能 的 ， 而 且 
极为 常见 。 你 可 以 像 下 面 这 样 把 错误 流 重 定向 到 另 一 个 文件 : 


$ ./menu2 >file 2>file.error 
$ 


或 者 如 下 面 这 样 ， 将 两 个 输出 流 重 定向 到 同一 个 文件 : 
$ ./menu2 >file 2>&1 
$ 


» menu); 
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如 果 你 不 熟悉 输出 重 定向 的 语法 ， 请 仔细 阅读 本 书 的 第 2 章 。 在 该 章 中 ， 我 们 详细 介绍 了 它 的 语 
法 。 在 本 例 中 ， 你 需要 将 错误 信息 直接 发 送 到 用 户 终端 上 。 
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如 果 不 希 望 程序 中 与 用 户 交互 的 部 分 被 重 定向 ,但 允许 其 他 的 输入 和 输出 被 重 定向 ， 你 就 需要 将 
与 用 户 交互 的 部 分 与 stdout 、stderr 分 离开 。 为 此 ， 你 可 直接 对 终端 进行 读 写 。 由 于 Linux 本 身 是 多 
用 户 系统 ， 它 通常 拥有 多 个 终端 ， 这 些 终端 或 者 是 直接 连接 的 ， 或 者 是 通过 网 络 进行 连接 的 ， 那 么 ， 
你 怎样 才能 找到 要 使 用 的 正确 终端 呢 ? 
的 是 ，Linux 和 UNIX 提 供 了 一 个 特殊 设备 /aev/cty 来 解决 这 一 问题 ， 该 设备 始终 是 指向 当前 
终端 或 当前 的 登录 会 话 。 由 于 Linux 把 一 切 事物 都 看 作为 文件 ， 所 以 你 可 以 用 一 般 文件 的 操作 方式 来 
对 /dev/tty 进 行 读 写 。 

在 下 面 的 实验 中 ， 你 通过 向 getchoice 函 数 传递 参数 的 方法 来 加 强 对 输出 的 控制 ， 修 改 后 的 程序 


为 menu3 .c。 


实验 使 用 /aev/tty 


以 menu2.c 程 序 为 蓝本 ， 对 其 做 如 下 修改 ， 使 得 输入 和 输出 直接 指向 /Gev/tty: 
#include <stdio.h> 
finclude <unistd.h> 
#include <stdlib.h> 





char *menu[] = { 
"a - add new record", 
"d - delete record", 
"q - qit", 
NULL, 


int getchoice(char *greet, char *choices[], FILE *in, FILE *out); 
int main() 

int choice = 0; 

FILE *input; 

FILE *output; 

if(isatty(fileno(stdout))) ( 

fprintf(stderr,"You are not a terminal, OK.Wn*); 
} 


input = fopen(*/dev/tty*, *r*); 
output = fopen(*/dev/tty*, *w*); 


if(tinput || toutput) { 
fprintf (stderr, "Unable to open /dev/tty|n*); 
exit(1); 


4 
do { 
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choice = getchoice(*Please select an action*, menu, input, output); 
printf ("You have chosen: $cWn*, choice); 

) while(choice !- 'q'); 

exit(0); 


int getchoice(char *greet, char *choices[], FILE *in, FILE *out) 


int chosen - 0; 
int selected; 
char **option; 


do ( 
fprintf(out,*Choice: $sWn*,greet); 
option - choices; 
while(*option) ( 
fprintf (out, "ts n* ,*option); 
option++; 
) 
do ( 
selected = fgetc(in); 
) while(selected == 'Wn'); 
option = choices; 
while(*option) ( 
if(selected 
chosen = 1; 
break; 








*option[0]) { 


Ld 
optione; 
) 
if(!chosen) ( 
fprintf (out, "Incorrect choice, select againin*); 





) 
) while(!chosen); 
return selected; 


) 
现在 ， 当 运行 这 个 程序 并 将 输出 进行 重 定向 时 ， 你 仍然 可 以 在 终端 上 看 到 菜单 提示 信息 ， 但 程序 
的 其 他 输出 (如 表明 菜单 项 已 被 选择 ) 则 被 重 定向 到 文件 中 。 


$ ./menu3 > file 

You are not a terminal, OK. 
Choice: Please select an action 
a - add new record 

d - delete record 

q - quit 

a 

Choice: Please select an action 
a - add new record 

d - delete record 


q- quit 
a 
$ cat file 


You have chosen: d 
You have chosen: q 
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5.8 ”终端 驱动 程序 和 通用 终端 接口 
有 时 , 程序 需要 更 精细 的 终端 控制 能 力 , 而 不 是 仅 通过 简单 的 文件 操作 来 完成 对 终端 的 一 些 控制 。 
Linux 提 供 了 一 组 编程 接口 用 来 控制 终端 驱动 程序 的 行为 ， 从 而 使 得 更 好 地 控制 终端 的 输入 和 输出 。 
5.3.1 概述 
如 图 5-1 所 示 ， 你 可 以 通过 一 组 函数 调用 (通用 终端 接口 ， 简 称 GTI) 来 控制 终端 这 组 函数 调用 
与 用 于 读 写 数据 的 函数 是 分 离 的 ， 这 就 使 得 读 写 数据 的 接口 非常 简洁 ， 同 时 又 允许 用 户 可 以 对 终端 的 
j 为 进行 更 精细 的 控制 。 但 这 并 不 意味 着 终端 WO 接口 也 非常 简洁 ， 相 反 ， 它 需要 支持 大 量 不 同类 型 的 




















控制 接口 
内 核 中 的 终端 
;驱动 程序 
图 5-1 
用 UNIX 的 术语 来 说 ， 控 制 接口 定义 了 一 个 “线路 规程 ”， 它 使 程序 在 指定 终端 驱动 程序 的 行为 时 


拥有 极 大 的 灵活 性 。 
下 面 是 你 能 够 控制 的 主要 功能 。 
O 行 编辑 : 是否 允许 用 退 格 键 进行 编 辑 。 
口 缓存 ， 是 立即 读 取 字 符 ， 还 是 等 待 一 段 可 配置 的 延迟 之 后 再 读 取 它 们 。 
口 回 显 :允许 控制 字符 的 回 显 ， 例 如 读 取 密码 时 。 
O 回 车 /换行 (CRILF): 定义 如 何在 输入 /输出 时 映射 回 车 /换行 符 ， 比 如 打印 \n 字 符 时 应 该 如 何 
处 理 。 
口 线 速 : 这 一 功能 很 少 用 于 PC 控制 台 ， 但 对 调制 解 调 器 或 通过 串 行 线 连接 的 终端 就 很 重要 。 


5.3.2 ”硬件 模型 


在 学 习 通 用 终端 接口 之 前 ， 你 十 分 有 必要 先 理解 它 所 要 驱动 的 硬件 模型 。 

图 5-2 所 示 的 概念 布局 图 ( 某 些 早期 UNIX 站 点 的 实际 情况 就 是 这 样 ) 是 让 一 台 UNIX 机 器 通过 串 行 
口 连接 一 台 调 制 解 调 器 ， 再 通过 电话 线 连 接 到 用 户 端的 调制 解 调 器 ， 该 调制 解 调 器 最 终 连 接 到 用 户 的 
终端 。 事实 上 ， 这 正 是 某 些小 型 ISP (因特网 服务 提供 商 ) 在 因特网 早期 使 用 的 一 种 配置 情况 。 这 种 
连接 方式 可 以 看 作 是 客户 /服务 器 模型 的 一 个 “远亲 ”， 它 用 于 程序 运行 在 大 型 主机 上 ， 而 用 户 工作 在 
哑 终 端的 情况 。 














“电话 ” 线 











图 5-2 
如 果 你 工作 在 一 台 运 行 着 Linux 系 统 的 PC 上 ， 可 能 会 认为 这 个 模型 过 于 复杂 。 但 因为 本 书 的 两 位 
作者 都 有 调制 解 调 器 ， 所 以 如 果 愿 意 的 话 ， 就 可 以 按照 图 中 的 方式 用 一 对 调制 解 调 器 和 电话 线 将 两 人 
的 电脑 连接 起 来 ， 并 通过 终端 仿真 程序 (如 minicom) 远程 登录 到 对 方 的 机 器 上 。 当 然 ， 如 今 的 快速 
宽带 接 入 已 让 这 种 类 型 的 连接 方式 过 时 ， 但 这 个 硬件 模型 仍 有 其 用 处 。 
使 用 这 样 一 个 硬件 模型 的 好 处 是 ， 绝 大 多 数 现实 世界 中 的 情况 都 只 是 这 一 最 复杂 情况 的 子 集 。 如 
果 这 个 模型 忽略 了 一 些 功能 ， 那 么 它 就 不 能 很 好 的 支持 各 种 现实 情况 。 


5.4 termios 结构 


termios 是 在 POSIX 规 范 中 定义 的 标准 接口 , 它 类 似 于 系统 V 中 的 termi co 接口。 通过 设置 ermios 
类 型 的 数据 结构 中 的 值 和 使 用 一 小 组 函数 调用 ， 你 就 可 以 对 终端 接口 进行 控制 。cermios 数 据 结构 和 
相关 函数 调用 都 定义 在 头 文件 termios.h 中 。 
如 果 程序 需要 调用 定义 在 termios.h 头 文件 中 的 函数 ， 它 就 需要 与 一 个 正确 的 通 数 库 进 
行 链接 ， 这 个 函数 库 可 能 是 标准 的 C 函 数 库 或 者 curses 函 数 库 (取决 于 你 的 安装 情况 )， 如 
果 需 要 ， 在 编译 本 章 中 的 示例 程序 时 ， 在 编译 命令 的 末尾 加 上 -lcurses。 在 一 些 老 版 本 的 
Linux 系 统 中 ，curses 库 被 命名 为 new curses。 在 这 种 情况 下 ， 库 名 和 链接 参数 就 需要 相应 地 


改 为 ncurses 和 -lncurses。 


可 以 被 调整 来 影响 终端 的 值 按照 不 同 的 模式 被 分 成 如 下 几 组 : 
口 输入 模式 
口 输出 模式 
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口 控制 模式 

口 本 地 模式 

口 特殊 控制 字符 

最 小 的 cermios 结 构 的 典型 定义 如 下 〈(X/Open 规 范 人 允许 包 含 附加 字段 ): 


#include «termios.h» 
struct termios ( 
tefl 





tefl 
tefl 

tcflag t c_lflag; 

cc t € ce[NCCS] ; 


HI 

结构 成 员 的 名 称 与 上 面 列 出 的 5 种 参数 类 型 相对 应 。 

你 可 以 调用 函数 tcgetattr 来 初始 化 与 一 个 终端 对 应 的 Lermios 结 构 ， 该 函数 的 原型 如 下 ; 
#include <termios.h> 

int tcgetattr(int fd, struct termios *termios p); 

这 个 函数 调用 把 当前 终端 接口 变量 的 值 写 入 rermios_p 参 数 指向 的 结构 。 如 果 这 些 值 其 后 被 修改 
你 可 通过 调用 函数 tcsetattr 来 重新 配置 终端 接口 ， 该 函数 的 原型 如 下 : 

#include <termios.h> 


E 


int tcsetattr(int fd, int actions, const struct termios *termios p); 

参数 accions 控 制 修改 方式 ， 共 有 3 种 修改 方式 ， 如 下 所 示 。 

O rcsaNow: 立刻 对 值 进行 修改 。 

O TCSADRAIN: 等 当前 的 输出 完成 后 再 对 值 进行 修改 。 

O TcsaFLUsH: 等 当前 的 输出 完成 后 再 对 值 进行 修改 , 但 丢弃 还 未 从 reaa 调 用 返回 的 当前 可 用 的 

任何 输入 。 
注意 ， 程 序 有 责任 将 终端 设置 恢复 到 程序 开始 运行 之 前 的 状态 ， 这 一 点 是 非常 重要 的 。 

首先 保存 这 些 值 ， 然 后 在 程序 结束 时 恢复 它们 ， 这 永远 是 程序 的 职责 . 

接 下 来 ， 我 们 将 仔细 分 析 各 种 模式 和 相关 的 函数 调用 。 一 些 模式 的 细节 非常 吃 涩 、 专 业 ， 而 且 很 
少 使 用 , 所 以 我 们 在 此 只 介绍 主要 的 功能 。 如 果 读 者 需要 了 解 更 多 内 容 , 请 查阅 man 帮 助手 册 或 POSIX、 
X/Open 的 规范 文档 。 

你 首先 应 该 了 解 的 是 本 地 模式 ， 它 也 是 最 重要 的 一 种 模式 。 我 们 在 本 章 中 编写 的 第 一 个 应 用 程序 
出 现 了 两 个 问题 ， 其 中 第 二 个 问题 〈 用 户 必须 按 下 回 车 键 才能 让 程序 读 取 输 入 ) 的 解决 方法 是 使 用 标 
准 模式 或 非 标准 模式 ， 即 你 可 以 让 程序 等 待 一 行 输入 完毕 后 再 进行 处 理 ， 或 让 它 一 有 字符 键入 就 立刻 
处 理 。 

5.4.1 输入 模式 

输入 模式 控制 输入 数据 终端 驱动 程序 从 串 行 口 或 键盘 接收 到 的 字符 ) 在 被 传递 给 程序 之 前 的 处 
理 方式 。 你 通过 设置 termios 结 构 中 c_iflag 成 员 的 标志 对 它们 进行 控制 。 所 有 的 标志 都 被 定义 为 宏 ， 
并 可 通过 按 位 或 的 方式 结合 起 来 。 这 也 是 所 有 终端 模式 都 采用 的 方法 。 

可 用 于 c_iflag 成 员 的 宏 如 下 所 示 。 
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O BRKINT: 当 在 输入 行 中 检测 到 一 个 终止 状态 《连接 丢失 ) 时 ， 产 生 一 个 中 断 。 
O IGNBRK: 忽略 输入 行 中 的 终止 状态 。 

口 ICRNL: 将 接收 到 的 回 车 符 转换 为 新 行 符 。 
口 IGNCR: 忽略 接收 到 的 回 车 符 。 

O INLCR: 将 接收 到 的 新 行 符 转换 为 回 车 符 。 
O IGNPAR: 忽略 奇偶 校 验 错误 的 字符 。 

口 INPCK: 对 接收 到 的 字符 执行 奇偶 校 验 。 

口 PARMRK: 对 奇偶 校 验 错误 做 出 标记 。 

O ISTRIP: 将 所 有 接收 到 的 字符 裁减 为 7 比特 。 
O IXOFF: 对 输入 启用 软件 流 控 。 

口 IxoN: 对 输出 启用 软件 流 控 。 


如 果 BRKINT 和 IGNBRK 标 志 都 未 被 设置 ， 则 输入 行 中 的 终止 状态 就 被 读 取 为 NULL (0x00) 





字符 . 

用 户 一 般 无 需 频繁 修改 输入 模式 ， 因 为 它 的 默认 值 通常 就 是 最 合适 的 ， 所 以 我 们 在 这 里 就 不 过 多 
讨论 了 。 
5.4.2 输出 模式 

输出 模式 控制 输出 字符 的 处 理 方式 ， 即 由 程序 发 送出 去 的 字符 在 传递 到 串 行 口 或 屏幕 之 前 是 如 何 
处 理 的 。 正 如 你 预料 的 那样 ， 许 多 处 理 方式 正好 与 输入 模式 对 应 。 它 还 有 几 个 其 他 标志 
速 终端 , 因为 这 些 终端 在 处 理 回 车 符 等 字符 时 需要 花费 一 fi 1 





主要 用 于 慢 
不 是 多 余 的 ( 因 


为 现在 的 终端 速度 比 以 前 要 快 得 多 )， 就 是 用 具有 终端 处 理 能 力 的 cerminfo 数 据 库 处 理会 更 有 效 (在 


本 章 的 后 面 你 会 用 到 该 数据 库 )。 


你 通过 设置 ermios 结 构 中 c_oflag 成 员 的 标志 对 输出 模式 进行 控制 .可 用 于 c_oflag 成 员 的 宏 如 


下 所 示 。 
口 oPosT: 打开 输出 处 理 功能 。 
口 oNLCR: 将 输出 中 的 换行 符 转换 为 回 车 /换行 符 。 
口 ocRNL: 将 输出 中 的 回 车 符 转换 为 新 行 符 。 
口 oNocR: 在 第 0 列 不 输出 回 车 符 。 
口 oNLRET 不 输出 回 车 符 。 O 
口 oFILL: 发 送 填充 字符 以 提供 延 时 。 
口 oFDEL: 用 DEL 而 不 是 NULL 字 符 作为 填充 字符 。 
口 NLDLY: 新 行 符 延 时 选择 。 
O CRDLY: 回 车 符 延 时 选择 。 
口 TABDLY: 制 表 符 延 时 选择 。 
口 BSDLY: 退 格 符 延 时 选择 。 
Q vrpLY: 垂直 制 表 符 延 时 选择 。 
口 FFDLY: 换 页 符 延 时 选择 。 


(D 原文 为 A newline also does a carriage retum， 这 里 的 译文 是 参考 Linux 在 线 帮助 手册 man termios 中 的 解释 ， 原 文 为 


Don't output CR。 译 者 认为 在 线 帮助 手册 中 的 解释 更 清楚 。 一 一 译 者 注 
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如 果 没 有 设置 oosT， 则 所 有 其 他 标志 都 被 忽略 。 
由 于 输出 模式 用 得 也 不 多 ， 所 以 我 们 在 此 也 不 做 过 多 的 讨论 。 


543 ”控制 模式 


控制 模式 控制 终端 的 硬件 特性 。 你 通过 设置 cermios 结 构 中 c_cflag 成 员 的 标志 对 控制 模式 进行 
配置 。 可 用 于 c_cflag 成 员 的 宏 如 下 所 示 。 

O CLOCAL: 忽略 所 有 调制 解 调 器 的 状态 行 - 

口 cREAD: 启用 字符 接收 器 。 

O css: 发 送 或 接收 字符 时 使 用 5 比特 。 

口 cs6: 发 送 或 接收 字符 时 使 用 6 比特 。 

口 cs7: 发 送 或 接收 字符 时 使 用 7 比特 。 

口 cs8: 发 送 或 接收 字符 时 使 用 8 比特 。 

口 csToPB: 每 个 字符 使 用 两 个 停止 位 而 不 是 一 个 。 

口 HUPCL: 关闭 时 挂 断 调制 解 调 器 。 

口 PARENB: 启用 奇偶 校 验 码 的 生成 和 检测 功能 。 

口 PARODD: 使 用 奇 校 验 而 不 是 偶 校 验 。 

如 果 设 置 了 HUPCL 标 志 ， 当 终端 驱动 程序 检测 到 与 终端 对 应 的 最 后 一 个 文件 描述 符 被 关 

闭 时 ， 它 将 通过 设置 调制 解 调 器 的 控制 线 来 挂 断 电话 线路 。 

控制 模式 主要 用 于 串 行 线 连接 调制 解 调 器 的 情况 ， 虽 然 它 也 可 用 来 和 终端 进行 “对 话 ”。 但 与 通 
过 使 用 cermios 的 控制 模式 来 修改 默认 的 线路 行为 相 比 ， 直 接 修改 终端 配置 文件 通常 更 加 容易 一 些 。 


5.44 ”本 地 模式 


本 地 模式 控制 终端 的 各 种 特性 。 你 通过 设置 Lermios 结 构 中 c_1f1ag 成 员 的 标志 对 本 地 模式 进行 
配置 。 可 用 于 c_1f1ag 成 员 的 宏 如 下 所 示 。 

口 EcHo: 启用 输入 字符 的 本 地 回 显 功 能 。 

O ECHOE: 接收 到 ERASE 时 执行 退 格 、 空 格 、 退 格 的 动作 组 合 。 

口 EcHOK: 接收 到 KILL 字 符 时 执行 行 删 除 操作 。 

O EcHoNL: 回 显 新 行 符 。 

口 ICaANON: 启用 标准 输入 处 理 〈 参 见 下 面 的 说 明 )。 

口 TEXTEN: 启用 基于 特定 实现 的 函数 。 

口 IsIG: 启用 信号 

口 NOFLSH: 禁止 清空 队列 。 

口 TosToP: 在 试图 进行 写 操作 之 前 给 后 台 进程 发 送 一 个 信号 。 

这 里 最 重要 的 两 个 标志 是 cto 和 ICaNoN。 前 者 的 作用 是 抑制 键入 字符 的 回 显 ， 而 后 者 是 将 终端 
在 两 个 截然 不 同 的 接收 字符 处 理 模式 间 进 行 切换 。 如 果 设 置 了 ICaNON 标 志 ， 就 启用 标准 输入 行 处 理 模 
式 ， 和 否则 ， 就 启用 非 标准 模式 。 


5.4.5 “特殊 控制 字符 


特殊 控制 字符 是 一 些 字符 组 合 ， 如 CtrlrkC， 当 用 户 键入 这 样 的 组 合 键 时 ， 终 端 会 采取 一 些 特殊 的 
处 理 方式 。termios 结 构 中 的 c_cc 数 组 成 员 将 各 种 特殊 控制 字符 映射 到 对 应 的 支持 函数 。 每 个 字符 的 





1566 第 5 章 ^ 端 





位 置 ( 它 在 数组 中 的 下 标 》 是 由 一 个 宏 定义 的 ， 但 并 不 限制 这 些 字符 必须 是 控制 字符 。 

根据 终端 是 否 被 设置 为 标准 模式 ( 即 termios 结 构 中 c_1f1ag 成 员 是 否 设置 了 ICANON 标 志 )，, c. cc 
数组 有 两 种 差别 很 大 的 用 法 。 

要 特别 注意 的 一 点 是 ， 在 两 种 不 同 的 模式 下 ， 数 组 下 标 值 有 一 部 分 是 重 盈 的。 出 于 这 个 原因 ， 你 
一 定 要 注意 不 要 将 两 种 模式 各 自 的 下 标 值 混用 。 

下 面 是 在 标准 模式 中 可 以 使 用 的 数组 下 标 。 

口 VEoF: EOF 字 符 。 

O veor: EOL 字 符 。 

口 VERASE: ERASE 字 符 。 

口 vINTR: INTR 字 符 。 

O vkILL: KILL 字 符 。 

O vourT: QUIT 字 符 。 

口 vsusP: SUSP 字 符 。 

O VSTART: START 字 符 。 

口 VsToP: STOP 字 符 。 

下 面 是 在 非 标准 模式 中 可 以 使 用 的 数组 下 标 。 

口 VINTR: INTR 字 符 。 

口 vuIN: MIN 值 。 

O vovIT: QUIT? 

口 vsusP: SUSP 字 符 。 

O vriwE: TIME 值 。 

O VSTART: START 字 符 。 

O VSTOP: STOP 字 符 。 

1. 字 符 

由 于 这 些 特殊 字符 和 非 标准 值 对 于 输入 字符 的 高 级 处 理 非常 重要 ， 所 以 我 们 在 这 里 对 它们 进行 详 
细 的 解释 ， 如 表 5-1 所 示 。 








* 54 

字 符 说 mw 

INTR 该 字符 使 终端 驱动 程序 向 与 终端 相连 的 进程 发 送 S1GINr 信 号 . 我 们 将 在 第 11 章 对 信号 做 进一步 介绍 

qur 该 字符 使 终端 又 动 程序 向 与 终端 相连 的 进程 发 送 sxoouTr 信 号 

ERASE 该 字符 使 终端 电动 程序 删除 输入 行 中 的 最 后 一 个 字符 

KILL 该 字符 使 终端 驱动 程序 刷 除 整个 输入 行 

EoF 该 字符 使 终端 驱动 程序 将 输入 行 中 的 全 部 字符 传递 给 正在 读 取 输 入 的 应 用 程序 。 如 果 输 入 行为 空 
reaq 调 用 将 返回 9， 就 好 像 在 文件 结尾 调用 zea 一样 

Bor 该 字符 的 作用 类 似 行 结束 符 ， 效 果 和 党 用 的 新 行 符 相同 

susp 该 字符 使 终端 驱动 程序 向 与 终端 相连 的 进程 发 送 srcsusp 信 号 。 如 果 你 的 UNIX 系 统 支持 作业 控制 功 
能 ， 当 前 应 用 程序 将 被 挂 起 

stor 该 字符 的 作用 是 “截流 ”， 即 阻止 向 终端 的 进一步 输出 。 它 用 于 支持 XON/XOFF 流 控 ， 通常 被 设置 


为 ASCII 的 xoFF 字 符 ， 即 组 合 键 Cut+S 
SINE 该 字符 重新 启动 被 srop 字 符 暂停 的 输出 ， 它 通常 被 设置 为 ASCII 的 xoN 字 符 
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2. TIME 和 MIN 值 
TIME 和 MIN 的 值 只 能 用 于 非 标准 模式 ， 两 者 结合 起 来 共同 控制 对 输入 的 读 取 。 此 外 ， 两 者 的 结合 
使 用 还 能 控制 在 一 个 程序 试图 读 取 与 一 个 终端 关联 的 文件 描述 符 时 将 发 生 的 情况 。 

两 者 的 结合 分 为 如 下 4 种 情况 。 

OMIN = 0 和 TIME = 0: 在 这 种 情况 下 ，read 调 用 总 是 立刻 返回 。 如 果 有 等 待 处 理 的 字符 ， 它 
们 就 会 被 返回 ， 如 果 没 有 字符 等 待 处 理 ，reaad 调 用 返回 0， 并 且 不 读 取 任何 字符 。 

OMIN = 0 和 TIME > 0: 在 这 种 情况 下 ， 只 要 有 字符 可 以 处 理 或 者 是 经 过 TIME 个 十 分 之 一 秒 的 
时 间 间 隔 ，read 调 用 就 返回 。 如 果 因 为 超时 而 未 读 到 任何 字符 ，reaG 返 回 0， 否 则 reaa 返 回 读 
取 的 字符 数目 。 

O MIN > 0 和 TIME = 0: 在 这 种 情况 下 ，reaad 调 用 将 一 直 等 待 ， 直 到 有 MIN 个 字符 可 以 读 取 时 才 
返回 ， 返 回 值 是 读 取 的 字符 数量 。 到 达 文件 尾 时 返回 0。 

OMIN > 0 和 TIME > 0: 这 是 最 复杂 的 一 种 情况 。 当 reaG 被 调用 时 ， 它 会 等 待 接收 一 个 字符 。 
在 接收 到 第 一 个 字符 及 后 续 的 每 个 字符 后 , 一 个 字符 间隔 定时 器 被 启动 (如 果 定 时 器 已 在 运行 ， 
则 重启 它 )。 当 有 MIN 个 字符 可 读 或 两 个 字符 之 间 的 时 间 间 隔 超过 TIME 个 十 分 之 一 秒 时 ，read 
调用 返回 。 这 个 功能 可 用 于 区 分 是 单独 按 下 了 Escape 键 还 是 按 下 一 个 以 Escape 键 开始 的 功能 
组 合 键 。 但 要 注意 的 是 ， 网 络 通信 或 处 理 器 的 高 负载 将 使 得 类 似 这 样 的 定时 器 失去 作用 。 

通过 设置 非 标 准 模式 与 使 用 4IN 和 TIME 值 ， 程 序 可 以 逐个 字符 地 处 理 输入 。 

3. 通过 shell 访 问 终 端 模式 

如 果 在 使 用 shell 时 想 查看 当前 的 termios 设 置 情况 ， 可 以 使 用 下 面 的 命令 : 

$ stty -a 

在 我 的 Linux 系 统 上 〔 它 对 标准 termios 结 构 进行 了 一 些 扩展 ) ， 这 个 命令 的 输出 如 下 : 

speed 38400 baud; rows 24; columns 80; line = 0; 

intr = ^C; quit = ^V; erase = ^?; kill 

eol2 = «undef»; swtch = -undef»; start 

werase = ^W; lnext = ^V; flush = ^0; mii ; 

-parenb -parodd cs8 -hupcl -cstopb cread -clocal -crtscts 

-ignbrk -brkint -ignpar -parmrk -inpck -istrip -inlcr -igncr icrnl -ixon -ixoff 

-iuclc -ixany -imaxbel iutf8 

opost -olcuc -ocrnl onlcr -onocr -onlret -ofill -ofdel nl0 cr0 tab0 bs0 vt0 ££0 


isig icanon iexten echo echoe echok -echonl -noflsh -xcase -tostop -echoprt 
echocti echoke 


从 上 面 的 命令 输出 中 ， 你 可 以 看 到 ，EOF 字 符 是 Ctrl+D 并 且 启用 了 本 地 回 显 。 当 在 做 终端 控制 的 
练习 时 ， 一 不 小 心 就 会 将 终端 设置 为 非 标准 状态 ， 这 将 使 得 终端 的 使 用 非常 困难 。 下 面 几 种 方法 可 以 
帮 你 摆脱 这 种 困境 。 

O 第 一 种 方法 是 使 用 如 下 命令 〈 这 要 求 你 的 scty 版 本 支持 这 种 用 法 ) : 

$ stty sane 

O 如 果 回 车 键 和 新 行 符 (用 于 终止 输入 行 ) 的 映射 关系 丢失 了 , 你 可 能 就 需要 输入 命令 stty sane, 

然后 按 下 CtrltJ〈 它 对 应 新 行 符 ) ， 而 不 是 按 下 回 车 键 Enter。 

O 第 二 种 方法 是 用 命令 stty -g 将 当前 的 secty 设 置 保存 到 某 种 可 以 重新 读 取 的 形式 中 。 使 用 的 命 

令 如 下 : 


$ stty -g > save stty 





eol - «undef»; 
; susp = ^Z; rprnt = ^R; 
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«experiment with settings» 


$ sety $(cat save_stty) 
口 注意 ， 对 最 后 一 个 sety 命 令 ， 你 可 能 还 需要 使 用 CtrltJ 的 组 合 键 来 代替 回 车 键 Enter。 你 也 可 以 
在 shell 脚 本 中 使 用 相同 的 方法 : 
save_stty="$ (stty -g)" 
<alter stty settings> 
stty $save_stty 
O 如 果 上 面 两 种 方法 都 不 能 解决 问题 , 还 有 第 三 种 方法 ， 就 是 从 另 一 个 终端 登录 ， 用 ps 命令 查找 
不 能 使 用 的 那个 shell 的 进程 号 ， 然 后 用 命令 xil1 HUP < 进程 号 > 强制 中 止 该 shell。 因 为 系统 总 
是 在 给 出 登录 提示 符 之 前 重 置 sccy 参 数 ， 所 以 你 就 可 以 正常 地 登录 系统 了 。 
4. 在 命令 提示 符 下 设置 终端 模式 
你 还 可 以 在 命令 提示 符 下 用 sccy 命 令 直接 设置 终端 模式 。 
比如 说 ， 如 果 想 让 shell 脚 本 可 以 读 取 单 字符 ， 你 就 需要 关闭 终端 的 标准 模式 ， 同 时 将 MIN 设 为 1， 
TIME 设 为 0。 使 用 的 命令 如 下 : 
$ stty -icanon min 1 time 0 
现在 终端 已 被 设置 为 可 立刻 读 取 字 符 了 。 如 果 重新 运行 第 一 个 程序 menu1， 你 会 发 现 它 将 按照 设 
计 的 要 求 正常 工作 。 
可 以 对 第 2 章 的 密码 检查 程序 加 以 改进 ， 在 程序 提示 和 输入 密码 前 将 回 显 功能 关闭 。 使 用 的 命 








令 如 下 : 
$ stty -echo 


注意 ， 在 使 用 上 面 命令 之 后 要 记 住 用 命令 stty echo 将 回 显 功能 再 次 恢复 启用 。 


54.6 ”终端 速度 


termios 结 构 提供 的 最 后 一 个 功能 是 控制 终端 速度 ， 但 termios 结 构 中 并 没有 与 终端 速度 对 应 的 
成 员 ， 它 是 通过 函数 调用 来 进行 设置 的 。 要 注意 的 是 ， 输 入 速度 和 输出 速度 是 分 开 处 理 的 。 

4 个 函数 调用 的 原型 如 下 : 

#include <termios.h> 


speed t cfgetispeed(const struct termios *); 
speed t cfgetospeed(const struct termios *); 
int cfsetispeed(struct termios *, speed t speed); 
int cfsetospeed(struct termios *, speed t speed); 


注意 ， 这 些 函数 作用 于 termios 结 构 ， 而 不 是 直接 作用 于 端口 。 这 意味 着 ， 要 想 设置 新 的 终端 束 
度 ， 你 就 必须 首先 用 函数 Lcgetattr 获 取 当前 终端 设置 ， 然 后 使 用 上 述 函数 之 一 设置 终端 速度 ， 最 后 
使 用 函数 Lcsetattr 写 回 Lermios 结 构 。 只 有 在 调用 了 函数 Lcsetattr 之 后 ， 终 端 速度 才 会 改变 。 

上 面 函数 调用 中 speea 参 数 可 设置 的 值 很 多 ， 下 面 是 最 重要 的 。 

口 B0: 挂 起 终端 。 

O B1200: 1200 波 特 。 

O B2400: 2400 波 特 。 

O B9600: 9600 波 特 。 
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O 519200: 192000 ff. 
O 238400: 38400 波 特 。 
标准 中 没有 定义 大 于 38400 波 特 的 速度 ， 也 无 标准 方法 用 来 支持 串 行 口 的 速度 大 于 它 。 

包括 Linux 在 内 的 一 些 操作 系统 ， 为 了 支持 更 高 的 速度 ， 补 充 定义 了 值 B57600、B115200 
和 B230400。 如 果 使 用 的 Linux 版 本 比较 低 ， 它 可 能 没有 定义 这 些 值 ， 但 可 以 通过 命令 
setserial 来 获取 57600 和 115200 这 样 的 非 标准 速度 .要 注意 的 是 ， 在 这 种 情况 下 ， 只 有 当先 
设置 了 B38400 后 ， 才 能 使 用 这 些 速 度 . 这 两 种 方法 都 不 具备 可 移植 性 ， 所 以 你 在 使 用 它们 时 
要 考虑 清楚 


5.4. ”其 他 函数 


在 控制 终端 方面 还 有 一 些 其 他 的 函数 。 它 们 直接 对 文件 描述 符 进行 操作 ， 不 需要 读 写 cermios 结 
构 。 它 们 的 定义 如 下 : 
#include «termios.h» 


int tcdrain(int fd); 
int tcflow(int fd, int flowtype); 
int tcflush(int fd, int in out selector); 


这 些 函 数 的 功能 如 下 所 示 。 

O 函数 tcarain 的 作用 是 让 调用 程序 一 直 等 待 ， 直 到 所 有 排队 的 输出 都 已 发 送 完毕 。 

O 函数 ccflow 用 于 暂停 或 重新 开始 输出 。 

O 函数 tcflush 用 于 清空 输入 、 输 出 或 者 两 者 都 清空 。 

我 们 已 介绍 完了 termios 结 构 ， 下 面 来 看 几 个 实用 的 例子 。 其 中 最 简单 的 大 概要 算 读 取 密 码 时 禁 
止 回 显 了 。 通 过 关闭 EcHo 标 志 即 可 做 到 这 一 


X wm 使 用 os 结构 的 密码 程序 
(1) 密码 程序 passwora.c 以 下 面 的 定义 开始 : 


#include «termios.h» 
#include <stdio.h> 
#include «stdlib.h» 








#define PASSWORD_LEN 8 


int main() 
{ 
struct termios initialrsettings, newrsettings; 
char password[PASSWORD LEN + 1]; 
(2) 接 下 来 ， 增 加 一 行 语句 来 获取 标准 输入 的 当前 设置 ， 并 把 这 些 值 保 存 到 刚才 创建 的 termios 
结构 中 


tcgetattr(fileno(stdin), &initialrsettings); 


(3) 对 原始 的 设置 值 做 一 份 副本 以 便 在 程序 结束 时 还 原 设置 。 在 termios 结 构 变量 newrsettings 
中 关闭 EcHO 标 志 ， 然 后 提示 用 户 输入 密码 : 
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newrsettings = initialrsettings; 
newrsettings.c lflag &= -ECHO; 


printf(*Enter password: *); 


(4) 接 下 来 ， 用 newrsettings 变 量 中 的 值 设置 终端 属性 并 读 取 用 户 输入 的 密码 。 最 后 ， 将 终端 属 
性 还 原 到 原来 的 样子 并 输出 刚才 读 取 的 密码 ， 但 这 让 刚才 的 努力 都 “白费 ”了 (这 只 是 为 了 说 明 回 显 
功能 恢复 了 ， 在 实际 程序 中 不 要 输出 密码 )。 
if(tcsetattr(fileno(stdin), TCSAFLUSH, &newrsettings) !- 0) { 
fprintf (stderr, "Could not set attributesin*); 
) 
else ( 
fgets(password, PASSWORD LEN, stdin); 
tcsetattr(fileno(stdin), TCSANOW, &initialrsettings); 
fprintf(stdout, "\nYou entered s\n", password); 
) 
exit(0); 
} 
运行 这 个 程序 ， 你 将 看 到 如 下 的 输出 : 
$ ./password 
Enter password: 
You entered hello 


$ 


在 这 个 例子 中 ， 用 户 输入 hello， 但 在 Enter password: 提 示 符 后 并 不 显示 用 户 输入 的 内 容 ， 直 
到 用 户 按 下 回 车 键 后 程序 才 有 输出 。 

请 注意 只 修改 你 需要 修改 的 标志 , 使 用 的 语法 结构 是 x &= -FLAG( 它 的 作用 是 清除 变量 x 中 由 FLAG 
标志 定义 的 比特 )。 如 果 需 要 ， 你 可 以 用 语法 结构 x |= FLAG 对 由 FLAG 标 志 定义 的 单个 比特 进行 置 位 ， 
虽然 在 上 面 的 例子 中 并 不 需要 这 样 做 。 

在 设置 终端 属性 时 ， 你 用 TcsaAFLUsH 丢 弃 用 户 在 程序 准备 好 读 取 数据 之 前 输入 的 任何 内 容 。 这 样 
的 处 理 方式 是 为 了 培养 用 户 的 一 个 好 习惯 ， 即 在 回 显 功 能 关闭 之 前 不 要 试图 输入 自己 的 密码 。 在 程序 
结束 之 前 ， 你 还 恢复 了 终端 的 原始 设置 。 

termios 结 构 的 另 一 种 常见 用 法 是 ， 将 终端 设置 为 这 样 一 种 状态 ， 一 旦 输入 字符 ， 程 序 就 立刻 读 
取 它 。 这 是 通过 关闭 标准 模式 并 结合 使 用 uIN 和 TIME 设 置 来 实现 的 。 


[3 ETT 


利用 新 学 到 的 知识 ， 你 可 以 对 菜单 程序 做 一 些 修 改 。 下 面 的 程序 menu4.c 基 于 menu3.c， 它 在 后 
者 中 插入 了 许多 来 自 passwora.c 中 的 代码 。 修 改 的 内 容 以 阴影 显示 ， 并 在 下 面 的 步骤 中 进行 了 解释 。 

(1) 在 程序 的 开始 ， 必 须 包含 一 个 新 的 头 文件 : 

#include <stdio.h> 

#include <unistd.h> 

#include <stdlib.h> 

*include <termios.h> 
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char *menu[] = ( 
"a - add new record", 
"d - delete record", 
"q - mit", 
NULL, 

E 


(2) 接 下 来 ， 需 要 在 main 函 数 中 声明 一 些 新 变量 


int getchoice(char *greet, char *choices[], FILE *in, FILE *out); 





int main() 

( 
int choice - 0; 
FILE *input; 
FILE *output; 
struct termios initial settings, new settings; 


(3) 在 调用 get choice 函 数 之 前 ， 需 要 改变 终端 的 特性 ， 插 入 下 面 这 些 语句 : 
if (!isatty(fileno(stdout]))) ( 
fprintf (stderr, "You are not a terminal, OK.n*); 





) 


input = fopen(*/dev/tty*, "r*); 
output = fopen(*/dev/tty*, *w*); 


if(tinput || output) ( 
fprintf(stderr, "Unable to open /dev/ttyWn*); 
exit(1); 


) 

tcgetattr(fileno(input),&initial settings); 

new settings - initial settings 

new settings.c lflag &= -ICANON; 

new settings.c lflag &= -ECHO; 

ttings.c cc[VMIN] = 

new settings.c cc[VTIME] - 0; 

new settings.c lflag &= -ISIG; 

if(tcsetattr(fileno(input), TCSANOW, &new settings) != 0) ( 
fprintf(stderr, "could not set attributes in*); 





) 
(4) 在 退出 程序 之 前 ， 还 需要 将 终端 属性 还 原 为 原来 的 值 : 


do ( 
choice - getchoice(*Please select an action*, menu, input, output); 
printf(*You have chosen: $cin*, choice); 
) while (choice !- 'q'); 
tcsetattr(fileno(input),TCSANOW,&initial settings); 
exit(0); 
) 


(5) 由 于 在 非 标准 模式 下 ， 默 认 的 回 车 和 换行 符 之 间 的 映射 已 不 存在 了 ， 所 以 需要 对 回 车 符 \r 进 
7 检查。 

int getchoice(char *greet, char *choices[], FILE *in, FILE *out] 

{ 








int chosen = 0; 
int selected; 
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Char **option; 


do ( 
fprintf(out, "Choice: $sWn",greet); 
option - choices; 
while(*option) ( 
fprintf(out, *isin*,*option); 


optione; 
) 
do ( 

selected = fgetc(in); 
) while (selected == '\n' || selected == '\r'); 


option - choices; 
while(*option) ( 
if(selected == *option[0]) ( 
chosen = 1; 
break; 
) 
optione; 
) 
itf(!chosen) ( 
fprintf(out, "Incorrect choice, select againin*); 


) while(!chosen); 
return selected; 
) 
除非 你 做 出 安排 否则 ， 当 用 户 按 下 ctr1+c 组 合 键 时 ,程序 将 终止 。 你 可 以 通过 在 本 地 模式 下 清 
除 ISTG 标 志 来 禁用 对 这 些 特殊 字符 的 处 理 。 要 做 到 这 一 点 ， 你 需要 在 main 函 数 中 增加 如 下 一 条 语句 ， 
如 前 面 的 步骤 所 示 : 
new settings.c lflag &- -ISIG; 
如 果 将 这 些 修改 放 入 菜单 程序 ， 则 只 要 用 户 一 键入 字符 就 会 立刻 得 到 程序 的 响应 ， 而 且 用 户 键入 
的 字符 不 会 回 显 。 


$ ./menu4 
Choice: Please select an action 
a - add new record 

d - delete recorá 

q - quit 

You have chosen: a 

Choice: Please select an action 
a - add new record 

d - delete record 


q - quit 
You have chosen: q 
$ 


如 果 按 下 组 合 键 Ctrl+c， 它 将 被 直接 传递 给 程序 ， 并 被 程序 认为 是 一 个 不 正确 的 菜单 选择 。 


5.5 ”终端 的 输出 


通过 使 用 cermios 结 构 ， 你 可 以 控制 键盘 的 输入 。 但 我 们 希望 对 程序 输出 到 屏幕 上 的 内 容 也 能 具 
有 同样 的 控制 能 力 。 在 本 章 的 一 开始 ， 你 用 printf 函 数 将 字符 输出 到 屏幕 上 ， 但 还 没有 办 法 将 输出 的 
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内 容 放置 到 屏幕 上 的 特定 位 置 。 
5.5.1 终端 的 类 型 


许多 UNIX 系 统 都 是 通过 终端 来 使 用 的 ， 虽 然 如 今 在 很 多 情况 下 ,“ 终 端 ”可 能 实际 上 只 是 在 PC 
上 运行 的 一 个 终端 仿真 程序 或 者 是 窗口 环境 中 的 一 个 终端 应 用 程序 ， 比 如 X11 中 的 xterm。 

历史 上 ， 不 同 的 制造 厂商 生产 了 大 量 的 各 种 类 型 的 硬件 终端 。 虽 然 它们 几乎 都 用 escape 转 义 序列 
(以 escape 字 符 开头 的 字符 串 ) 来 控制 光标 的 位 置 和 终端 的 其 他 属性 一 一 比如 黑体 和 闪烁 等 ， 但 在 具体 
实现 手段 上 并 没有 统一 的 标准 。 某 些 陈 旧 的 终端 还 使 用 不 同 的 卷 屏 方式 ， 这 将 导致 使 用 退 格 键 时 可 能 
会 删除 字符 ， 也 可 能 不 会 删除 字符 ， 凡 此 种 种 ， 不 一 而 足 。 

escape 转 义 序列 有 一 个 ANSI 标 准 ， 它 以 数字 设备 公司 (DEC 公司 ) 的 VT 系 列 终端 所 使 用 
的 转 义 序列 为 基础 ， 但 并 不 完全 一 致 。 许 多 软件 终端 程序 提供 了 对 标准 硬件 终端 如 VT100、 
VT220、ANSI 等 的 仿真 功能 。 


对 程序 员 来 说 ， 如 果 他 希望 编写 一 个 可 以 控制 屏幕 输出 的 软件 ， 并 且 能 够 运行 在 各 种 类 型 的 终端 
之 上 , 则 硬件 终端 的 多 样 性 是 程序 员 要 面 对 的 一 个 主要 问题 。 例如, ANSI 终 端 使 用 转 义 序列 Escape,[,A 
将 光标 移动 到 上 一 行 , 而 ADM-3a 终 端 (多 年 前 它 是 一 种 很 常见 的 终端 ) 只 需 使 用 一 个 控制 字符 Ctrl+K 
就 可 以 完成 这 一 任务 。 

编写 能 够 应 付 连接 到 UNIX 系 统 上 的 各 种 不 同类 型 终端 的 程序 ， 看 上 去 是 一 项 非常 让 人 萌 惧 的 任 
务 。 这 样 的 程序 必须 针对 每 种 类 型 的 终端 编写 相应 的 代码 。 

让 人 欣慰 的 是 ，terminfo 软 件 包 的 出 现 解决 了 这 一 问题 。 程 序 不 再 需要 去 迎合 每 种 类 型 的 终端 ， 
取而代之 的 是 ， 程 序 通 过 查询 终端 类 型 数据 库 来 找到 正确 的 终端 信息 。 在 大 多 数 现代 UNIX 系 统 ( 包 
括 Linux》 中 ， 这 个 软件 包 和 另 一 个 软件 包 curses 集 成 在 一 起 。 你 将 在 下 一 章 学 习 后 者 。 

为 了 使 用 terminfo 函 数 , 你 通常 需要 在 程序 中 包括 curses 头 文件 curses.h 和 terminfo 自 己 的 头 
文件 term.h。 在 一 些 Linux 系 统 上 ， 你 可 能 不 得 不 使 用 被 称 为 ncurses 的 curses 实 现 ， 并 在 程序 中 包 
括 ncurses.h 头 文件 以 提供 对 terminfo 函 数 的 原型 定义 。 


5.5.2 ”识别 终端 类 型 


Linux 环 境 包 含 一 个 变量 TERM， 它 的 值 被 设置 为 当前 正在 使 用 的 终端 类 型 。 这 通常 是 由 系统 在 用 
户 登录 时 自动 设置 的 。 系 统管 理 员 可 以 针对 每 个 直接 连接 的 终端 设置 默认 的 终端 类 型 ， 对 于 网 络 
远程 连接 的 用 户 ， 可 以 提示 用 户 选择 自己 的 终端 类 型 。TERM 环 境 变 最 的 值 可 以 通过 telnet 进 行 协商 ， 
并 由 rlogin 程 序 进行 传递 。 

用 户 可 以 通过 查询 shell 来 了 解 ， 从 系统 的 角度 看 自己 正在 使 用 的 终端 是 何 种 类 型 的 : 

$ echo $TERM 

xterm 


$ 

在 这 个 例子 中 ，shell 是 通过 xterm 程 序 (一 个 X 视 窗 系统 中 的 终端 仿真 程序 ) 或 是 提供 类 似 功 能 的 
程序 (如 KDE 的 Konsole 或 GNOME 的 gnome-terminal) 运行 的 。 

terminfo 软 件 包 包含 一 个 由 大 量 不 同类 型 终端 的 功能 标志 和 escape 转 义 序列 等 信息 构成 的 数据 
库 ， 并 且 为 使 用 它们 提供 了 一 个 统一 的 编程 接口 。 一 个 使 用 这 个 软件 包 的 程序 能 够 随 着 数据 库 的 扩展 
来 适应 未 来 的 终端 类 型 ， 对 不 同类 型 终端 的 支持 不 再 需要 由 应 用 程序 自身 来 提供 。 

terminfo 的 功能 标志 由 属性 描述 ， 它 们 被 保存 在 一 组 编译 好 的 terminfo 文 件 中 ， 这 些 文件 通常 
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可 以 在 /usr/1ib/terminfo 或 /usr/share/terminfo 目 录 中 找到 . 每 个 终端 (包括 许多 不 同类 型 的 打 
印 机 ， 它 们 也 可 以 通过 terminfo 来 定义 ) 都 有 一 个 定义 其 功能 标志 和 如 何 访问 其 特征 的 文件 。 为 避免 
创建 一 个 很 大 的 目录 ， 真 正 的 文件 都 保存 在 下 一 级 的 子 目录 中 ， 子 目录 名 就 是 终端 类 型 名 的 第 一 个 字 
母 。 例如，VT100 终 端的 定义 就 放 在 文件 . . .terminfo/v/vt100 中 。 

每 个 终端 类 型 对 应 一 个 rerminfo 文 件 ， 文 件 格式 是 可 读 的 源 代 码 ， 然 后 通过 cic 命 令 将 源 文件 编 
译 为 更 加 紧 次、 有 效 的 格式 ， 以 方便 应 用 程序 的 使 用 。 奇 怪 的 是 ，X/Open 规 范 提 到 了 源 文件 和 编译 格 
式 的 定义 ， 但 却 未 提 到 把 源 文件 转换 为 编译 格式 的 tic 命 令 。 你 可 以 用 infocmp 程 序 输出 已 编译 
terminfo 数 据 项 的 可 读 版 本 。 

下 面 是 VT100 终 端 对 应 的 terminfo 文 件 的 样本 ; 

$ infocmp vt100 

vt100|vt100-am|dec vt100 (w/advanced video), 

am, mir, msgr, xenl, xon, 

cols#80, it#8, lines#24, vt#3, 

“aaffggjjkkllmmnnooppqgrrssttuuvvwwexyyzz{{||}}~~, 
; blink-WE[5m$«2», boldeVE[1m$«2», 

VE[HVE[J$«50», cr=\r, csrs VE[Sitpltd; tp2sár, 
[8pl&dD, cubleVb, cud=\E[$pl%dB, cudlen, 

cuf» VE(SpltdC, cufl=\E[C$<2>, 
cup-VE[Sispléd;tp28dH$«5», cuu- E[Sp18dA, 
cuuleVE[A$«2», ed-VE[J$«50», el=\E[K$<3>, 
ell=\E[1K$<3>, enacs=\E(B\E)0, home=\E[H, ht=\t, 
hts-VEH, ind=\n, kaleVEOq, ka3-VEOs, kb2=\EOr, kbs=\b, 
kcl-XEOp, kc3=\EOn, kcubleVEOD, kcudl=\EOB, 

kcufleNEOC, kcuul-VEOA, kent=\EOM, kf0=\EOy, kfl-VEOP, 
kf10=\EOx, kf2-VEOQ, kf3=\EOR, kf4-VEOS, kf5=\EOt, 

Ou, kf7-VEOv, kf8-VEOl, kf9=\EOw, rc- EB, 

[7m$«2», ri=\EM$<5>, rmacs=^0, rmkxeVE[?11 E», 
E(m$«2», rmul-WE[m$«2», 
>\E[?31\E[?41\E[?51\E[?7h\E[?8h, sc=\E7, 
sgr-NE[08?$p1$pé$ [tt ; 5p2$t; 4$; $?8p1$p3t | t; 7$; V28p4$t; 58; m$ pt NSe 0%; , 
sgrÜ-VE[m^O$«2», smacs-^N, smkx=\E[?1h\E=, 
smsosVE[1;7m$«2», smuleVE[4m$«2», tbc-VE[3g, 


每 个 cerminfo 定 义 由 3 种 类 型 的 数据 项 组 成 。 每 个 数据 项 被 称 为 capname， 它 们 分 别 用 于 定义 终 
端的 一 种 功能 标志 。 

布尔 功能 标志 指出 终端 是 否 支持 某 个 特定 的 功能 。 例 如 ， 如 果 终 端 支 持 XON/XOFF 流 控 ， 则 在 该 
终端 对 应 的 terminfo 文 件 中 定义 布尔 功能 标志 xon。 

数值 功能 标志 定义 长 度 ， 例 如 : lines 定 义 的 是 屏幕 上 可 以 显示 的 行 数 ，cols 定 义 的 是 屏幕 上 可 
以 显示 的 列 数 。 具 体 数 字 和 功能 标志 名 之 间 用 字符 # 隔 开 。 如 果 要 定义 一 个 有 80 列 24 行 显示 范围 的 终 
端 ， 可 以 写 为 cols#80，lines#24。 

字符 串 功能 标志 稍微 复杂 一 些 。 它 用 来 定义 两 种 截然 不 同 的 终端 功能 : 用 于 访问 终端 功能 的 输出 
字符 串 和 当 用 户 按 下 特定 按键 《通常 是 功能 键 或 在 数字 小 键盘 上 的 特殊 键 ) 时 终端 接收 到 的 输入 字符 
串 。 有 些 字符 串 功能 标志 非常 简单 ， 例 如 el 表示 “删除 到 行 尾 "。 在 VT100 终 端 上 ， 用 于 完成 这 一 功 
能 的 escape 转 义 序列 是 Esc,[,K， 在 terminfo 源 文件 中 写 为 e1=\E[k。 

特殊 键 的 定义 也 采用 类 似 的 方法 。 例 如 ，VT100 终 端 上 的 F1 功 能 键 发 送 的 escape 转 义 序列 是 
Esc,O,P， 它 被 定义 为 kf1=\EOP。 











5.5 终端 的 输出 165 





当 escape 转 义 序列 本 身 还 需要 带 有 参数 时 ， 情 况 会 变 得 更 加 复杂 。 大 多 数 终端 都 能 将 光标 移动 到 
一 个 特定 的 行列 位 置 。 很 明显 ， 为 光标 可 能 移动 到 的 每 个 位 置 定义 一 个 功能 标志 是 不 现实 的 ， 解 决 方 
法 是 使 用 一 个 通用 的 字符 串 功能 标志 ， 在 使 用 这 个 字符 串 时 ， 通 过 插入 参数 来 确定 光标 要 移动 到 的 确 
定位 置 。 例 如 ，VT100 终 端 通过 转 义 序列 Esc, [,<row>, ; ,<col>,H 将 光标 移动 到 一 个 特定 位 置 。 在 
terminfo 源 文件 中 ， 它 被 写 为 相当 复杂 的 字符 串 cup=\E[%i%pl%d;%p2%GH$<5>。 

下 面 给 出 了 它 的 含义 。 

口 \E: 发 送 Escape 字 符 。 

口 [: 发 送 [字符 。 

asi; 增加 参数 值 。 

口 sp1: 将 第 一 个 参数 放 入 栈 。 

Osa: 将 栈 上 的 数字 输出 为 一 个 十 进 制 数 。 

口 :: 发 送 ;字符 。 

口 sp2: 将 第 二 个 参数 放 入 栈 。 

Q sa: 将 栈 上 的 数字 输出 为 一 个 十 进 制 数 。 

口 H; 发 送 H 字 符 。 

这 种 写法 看 起 来 非常 复杂 ， 但 它 允 许 参数 以 固定 的 顺序 排列 ， 与 终端 期 望 它们 出 现在 最 终 escape 
转 义 序列 中 的 顺序 无 关 。%i 的 作用 是 增加 参数 的 值 ， 它 是 必 不 可 少 的 ， 因 为 标准 的 光标 寻 址 方法 是 将 
屏幕 的 左上 角 看 做 是 〈0,0)， 而 VT100 终 端 把 这 个 位 置 定义 为 《1,1)。 最 后 的 sS<5> 表 示 需 要 延迟 一 段 
时 间 ， 该 时 间 的 长 度 为 输出 五 个 字符 所 花费 的 时 间 ， 终 端 将 利用 这 段 时 间 来 处 理光 标的 移动 。 

我 们 可 以 自己 定义 许多 功能 标志 ， 但 幸运 的 是 ， 大 多 数 UNIX 和 Linux 系 统 已 经 预定 义 好 

了 大 部 分 终端 的 功能 标志 .如果 需要 增加 一 个 新 终端 ， 你 可 以 在 erminfo 的 手册 页 中 找到 完 

整 的 功能 标志 列表 . 一 种 比较 好 的 方法 是 首先 找到 与 新 终端 类 似 的 一 个 终端 ,以 它 为 出 发 点 ， 

将 新 终端 定义 为 这 个 已 有 终端 的 变 体 ， 或 者 逐个 对 新 终端 的 功能 标志 进行 定义 ， 按 需要 修改 

它们 。 

除了 terminfo 的 手册 页 以 外 ， 你 还 可 以 参考 由 O"Reilly 出 版 的 Termcap and Terminfo (4t 
者 是 John Strand, Linda Mui 和 Tim ). 


5.5.8 ”使 用 terminfo 功能 标志 

现在 ， 你 已 知道 如 何 定义 终端 的 功能 标志 ， 你 还 需 知道 如 何 访问 它们 。 当 使 用 terminfo 时 ， 你 要 
做 的 第 一 件 事情 就 是 调用 函数 setupterm 来 设置 终端 类 型 ， 这 将 为 当前 的 终端 类 型 初始 化 一 个 
TERMINAL 结 构 。 然 后 ， 你 就 可 以 查看 当前 终端 的 功能 标志 并 使 用 它们 的 功能 了 。setupterm 函 数 的 调 
用 方法 如 下 所 示 : 


#include <term.h> 








int setupterm(char *term, int fd, int *errret); 

setupterm 库 函数 将 当前 终端 类 型 设置 为 参数 cerm 指 向 的 值 ， 如 果 cerm 是 空 指针 ， 就 使 用 环境 变 
量 TERM 的 值 。 参 数 fd 为 一 个 打开 的 文件 描述 符 ， 它 用 于 向 终端 写 数据 。 如 果 参 数 errret 不 是 一 个 空 指 
针 ， 则 函数 的 返回 值 保存 在 该 参数 指向 的 整 型 变量 中 ， 下 面 给 出 了 可 能 写 入 的 值 。 

口 -1: terminfo 数 据 库 不 存在 。 

口 0: terminfo 数 据 库 中 没有 匹配 的 数据 项 。 
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口 1: 成 功 。 

setupterm 函 数 在 成 功 时 返回 常量 OK, 失败 时 返回 ERR。 如 果 errret 被 设置 为 空 指针 , setupterm 
函数 会 在 失败 时 输出 一 条 诊断 信息 并 导致 程序 直接 退出 ， 就 像 下 面 这 个 例子 : 

#include «stdio.h» 

#include <term.h> 

#include <curses.h> 

#include «stdlib.h» 


int main() 


setupterm(*unlisted*,fileno(stdout), (int *)0); 
printf(*Done.in"*); 
exit(0); 


在 你 的 系统 中 运行 这 个 程序 的 结果 可 能 和 这 里 给 出 的 不 完全 一 样 ， 但 含义 是 很 清楚 的 。 字 符 串 
Done 不 会 输出 ， 因 为 setupterm 函 数 会 在 执行 失败 时 导致 程序 直接 退出 。 

$ cc -o badterm badterm.c -lncurses 

$ ./badterm 

'unlisted': unknown terminal type. 





请 注意 这 个 例子 中 的 编译 命令 行 : 在 这 个 Linux 系 统 上 , 我 们 使 用 的 是 curses 函 数 库 的 ncurses 实 现 ， 
并 使 用 位 于 标准 位 置 的 标准 头 文件 。 在 这 类 系统 上 ， 你 可 以 直接 在 程序 中 包含 curses.h 头 文件 ， 并 在 
编译 时 为 库 文件 指定 -lncurses 选 项 。 

对 于 菜单 选择 函数 来 说 ， 你 希望 它 能 够 首先 清 屏 ， 然 后 在 屏幕 上 移动 光标 并 将 数据 写 到 屏幕 的 不 
同位 置 。 在 成 功 调用 setupterm 函 数 后 ， 你 即 可 通过 如 下 3 个 函数 调用 来 访问 terminfo 的 功能 标志 ， 
每 个 函数 对 应 一 个 功能 标志 类 型 : 


#include <term.h> 


int tigetflag(char *capname); 

int tigetnum(char *capname); 

char *tigetstr(char *capname); 

函数 tigetflag、tigetnum 和 tigetstr 分 别 返 回 cerminfo 中 的 布尔 功能 标志 、 数 值 功能 标志 和 
字符 串 功能 标志 的 值 。 失 败 时 (例如 ， 某 个 功能 标志 不 存在 ) ，tigetflag 函 数 返回 -1，tigetnum 
函数 返回 -2，tigetstr 函 数 返回 (char *)-1. 

你 可 以 用 terminfo 数 据 库 来 查找 当前 终端 的 显示 区 大 小 ， 下 面 的 程序 sizeterm.c 通 过 获取 cols 
和 1ines 功 能 标志 来 实现 这 一 功能 : 

#include <stdio.h> 

#include <term.h> 


#include <curses.h> 
#include «stdlib.h» 


int main() 
{ 
int nrows, ncolums; 


setupterm(NULL, fileno(stdout), (int *)0); 
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nrows = tigetnum{"lines"); 

ncolumns = tigetnum(*cols*); 

printf(*This terminal has $d columns and $d rows\n", ncolumns, nrows); 
exit(0); 


) 


$ echo $TERM 

vt100 

$ ./sizeterm 

This terminal has 80 columns and 24 rows 

$ 

如 果 在 一 台 工 作 站 的 一 个 窗口 中 运行 这 个 程序 ， 输 出 结果 将 反映 当前 窗口 的 大 小 ， 如 下 所 示 : 

$ echo $TERM 

xterm 

$ ./sizeterm 

This terminal has 88 columns and 40 rows 

s 

如 果 用 cigecstr 函 数 来 获取 xcerm 终 端 类 型 的 光标 移动 功能 标志 cup 的 值 ， 你 将 会 得 到 一 个 参数 
化 的 结果 \E[%p1%a; sp2%aH。 

这 个 功能 标志 需要 两 个 参数 : 光标 要 移动 到 的 行 号 和 列 号 。 这 两 个 坐标 都 是 从 0 开始 计算 的 ，(0,0) 
表示 屏幕 的 左上 角 。 

你 可 以 使 用 cparm 函 数 用 实际 的 数值 替换 功能 标志 中 的 参数 ， 一 次 最 多 可 以 替换 9 个 参数 ， 并 返回 

-个 可 用 的 escape 转 义 序列 。 该 函数 的 定义 如 下 : 


#include «term.h» 


Char *tparm(char *cap, long pl, long p2, ..., long p9); 

当 用 cparm 函 数 构造 好 终端 的 escape 转 义 序列 后 ， 你 必须 将 其 发 送 到 终端 。 要 想 正 确 地 完成 这 一 操 
作 ， 你 不 能 通过 printt 函 数 将 字符 串 发 送 到 终端 ， 而 必须 使 用 系统 提供 的 如 下 几 个 特殊 函数 ， 这 些 函 
数 可 以 正确 地 处 理 终端 完成 一 个 操作 所 需要 的 延 时 : 

#include <term.h> 


int putp(char *const str); 

int tputs(char *const str, int affcnt, int (*putfunc) (int)); 

putp 函 数 在 成 功 时 返回 ok， 失 败 时 返回 ERR。 它 以 一 个 终端 控制 字符 串 为 参数 ， 并 将 其 发 送 到 标 
准 输出 stdout。 

所 以 ， 如 果 要 将 光标 移动 到 屏幕 上 的 第 5 行 第 30 列 ， 你 可 以 使 用 如 下 代码 段 : 

Char *cursor; 

char *esc sequence; 

cursor = tigetstr("cup*); 

esc sequence = tparm(cursor,5,30); 

putp(esc, sequence) ; 

tpucs 函 数 是 为 不 能 通过 标准 输出 scaout 访 问 终端 的 情况 准备 的 ， 它 可 以 指定 一 个 用 于 输出 字符 
的 函数 。tputs 函 数 的 返回 值 是 用 户 指定 的 函数 put func 的 返回 结果 。 参 数 affcnt 的 作用 是 表明 受 这 
一 变化 影响 的 行 数 ， 它 一 般 被 设置 为 1。 真 正 用 于 输出 控制 字符 串 的 函数 的 参数 和 返回 值 类 型 必须 与 
putchar 函 数 相同 。 事实 上 , 函数 调用 putp string) 就 等 同 于 函数 调用 tputs (string,1, putchar) 
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在 下 一 个 例子 中 ， 你 将 看 到 tputs 函 数 使 用 用 户 指定 的 输出 函数 的 情况 。 
注意 , 一 些 老 版 本 的 Linux 将 tputs 函 数 的 最 后 一 个 参数 定义 为 int (*put func) (char), 如 果 是 这 
样 ， 你 就 必须 修改 下 面 实验 中 的 char_to_terminal 函 数 的 定义 。 

如 果 通 过 手册 页 查找 与 tparm 函 数 以 及 终端 功能 标志 相关 的 信息 ， 你 可 能 会 看 到 函数 
tgoto。 用 该 函数 来 移动 光标 会 更 加 简单 ， 但 我 们 并 未 使 用 它 ， 原 因 是 在 1997 年 版 的 X/Open 
规范 (单一 UNIX 规 范 版 本 2) 中 并 未 包含 该 函数 的 定义 。 因此， 我 们 建议 读者 在 新 编写 的 程 
序 中 也 不 要 使 用 这 类 函数 . 


向 菜单 选择 函数 里 添加 屏幕 处 理 功能 的 准备 工作 已 基本 就 绪 ， 现 在 唯一 未 提 到 的 就 是 清 屏 操作 。 
这 一 操作 可 以 通过 使 用 clear 功 能 标志 来 完成 ， 它 首先 清 屏 ， 然 后 将 光标 放 到 屏幕 的 左上 角 。 但 有 些 
终端 并 不 支持 clear 功 能 标志 , 此 时 , 你 需要 首先 将 光标 移动 到 屏幕 的 左上 角 , 然后 使 用 命令 ea (delete 
to end of display， 删 除 到 显示 区 域 结尾 )。 

将 上 面 这 些 内 容 结合 在 一 起 ， 你 将 编写 样本 菜单 程序 的 最 终 版 本 screenmenu.c， 它 将 把 菜单 先 
项 “ 画 ” 在 屏幕 上 供用 户 选择 。 


*owb 完整 的 终端 控制 


你 可 以 重新 编写 nenu4.c 中 的 gecchoice 函 数 以 提供 完整 的 终端 控制 功能 。 在 下 面 的 程序 清单 中 ， 
我 们 省 略 了 main 函 数 ， 因 为 无 需 对 其 进行 修改 。 其 他 与 menu4 .c 不 一 致 的 地 方 都 以 灰色 背景 显示 。 

#include <stdio.h> 

#include <unistd.h> 

#include <stdlib.h> 

#include <termios.h> 

#include «term.h» 

#include «curses.h» 





static FILE *output_stream = (FILE *)0; 


char *menu[] = ( 
"a - add new record", 
"d - delete record", 
"q - quit, 
NULL, 

M 


int getchoice(char *greet, char *choices[], FILE *in, FILE *out); 
int char to terminal(int char to write); 


int main() 


t 
} 


int getchoice(char *greet, char *choices[], FILE *in, FILE *out) 
t 

int chosen - 0; 

int selected; 

int screenrow, screencol - 10; 
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char **option; 
char *cursor, *clear; 


output stream - out; 
setupterm(NULL,fileno(out), (int *)0); 


cursor = tigetstr ("cup") 
Clear = tigetstr("clear* 





Screenrow = 4; 
tputs(clear, 1, (int *) char to terminal); 
tputs(tparm(cursor, screenrow, screencol), 1, char to terminal); 
fprintf(out, "Choice: $s, greet); 
Screenrow += 2; 
option = choices; 
while(*option) ( 
tputs(tparm(cursor, screenrow, screencol), 1, char to terminal); 
fprintf(out,"$s", *option); 
Screenrow+: 
optione*; 








) 
fprintf(out, "1n*); 


do ( 

fflush(out) ; 
selected = fgetc(in); 
option = choices; 
while(*option) ( 
if(selected =: 
chosen = 1; 

break; 





*option[0]) ( 


) 
optionee; 
) 
if(!chosen) ( 
tputs(tparm(cursor, screenrow, screencol), 1, char to terminal]; 
fprintf (out, "Incorrect choice, select againin*); 
) 
) while(!chosen); 
tputs(clear, 1, char to terminal); 
return selected; 


int char to terminal(int char to write) 


if (output stream) putc(char to write, output stream); 
return 0; 


将 这 个 程序 保存 为 menu5 . c. 
重新 编写 的 getchoice 函 数 实现 的 菜单 内 容 与 前 面 的 例子 完全 一 样 ， 但 其 屏幕 输出 部 分 进行 了 修 
改 以 充分 利用 terminfo 的 功能 标志 。 在 用 户 进行 下 一 次 选择 前 , 程序 会 有 清 屏 操作 ， 如 果 想 在 清 屏 之 
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前 让 信息 You have chosen: 在 屏 攻 上 多 停留 一 会 儿 ， 你 可 以 在 main 函 数 中 增加 一 条 调用 sleep 函 数 
的 语句 ， 如 下 所 示 : 
do ( 
Choice = getchoice(*Please select an action", menu, input, output); 
Pprintf(*XnYou have chosen: èc\n", choice); 
sleep(1); 
) while (choice != 'q'); 
这 个 程序 里 的 最 后 一 个 函数 char_co_rerminal 包 含 了 对 pucc 函 数 的 调用 ， 我 们 将 在 第 3 章 介绍 
Putc 函 数 。 为 使 本 章 内 容 更 加 完整 ， 我 们 再 看 一 个 如 何 检测 用 户 击 键 动作 的 程序 示例 。 





5.6 ”检测 击 键 动作 


曾经 为 MS-DOS 编 写 程序 的 人 们 经 常会 在 Linux 系 统 中 寻找 一 个 与 kbhit 函 数 等 同 的 函数 ，kbhit 函 
数 可 在 没有 实际 进行 读 操作 之 前 检测 是 否 某 个 键 被 按 过 。 遗 鳄 的 是 ， 他 们 找 不 到 这 样 的 函数 ， 因 为 
Linux 系 统 中 没有 与 其 直接 等 同 的 函数 。 但 UNIX 程 序 员 对 此 并 不 在 意 ， 因 为 在 UNIX 下 编写 的 程序 几 
乎 不 或 很 少 忙于 等 待 某 个 事件 的 发 生 。 由 于 kbhit 函 数 的 主要 用 途 就 是 等 待 某 个 击 键 动作 的 发 生 ， 所 
以 在 UNIX 和 Linux 系 统 上 未 实现 类 似 的 函数 。 

但 当 和 需要 移植 MS-DOS 下 的 程序 时 ， 如 果 能 够 模拟 kbhit 函 数 所 完成 的 功能 将 会 很 方便 。 你 可 以 
用 非 标准 输入 模式 来 实现 它 。 


实验 你 自己 的 xbhit 函 数 


(1) 程序 开始 是 标准 的 程序 头 和 一 组 对 终端 设置 结构 的 声明 ， 变 量 peek_character 将 用 在 测试 击 
键 动作 的 代码 中 ， 然 后 是 程序 后 面 会 用 到 的 一 些 函数 的 原型 定义 。 


#include «stdio.h» 
#include <stdlib.h> 

#include <termios.h> 

#include <term.h> 

#include «curses.h» 

#include <unistd.h> 

static struct termios initial_settings, new_settings; 
static int peek_character = -1; 
void init_keyboard(); 

void close keyboard(); 

int kbhit(); 

int readch(); 


(2) main 函 数 首先 调用 init_keyboard 函 数 来 配置 终端 ， 然 后 每 隔 一 秒 循环 调用 一 次 kbhit 函 数 。 
如 果 按键 为 gs， 就 退出 循环 并 调用 close_keyboara 函 数 恢复 终端 为 标准 模式 ， 最 后 退出 程序 。 
int main() 


{ 
int ch = 0; 


init keyboard(); 
while(ch != 'q') ( 
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printf ("looping\n" 
sleep(1); 
if(kbhit()) { 
ch = readch(); 
printf ("you hit %c\n*,ch); 





) 


close keyboard(); 
exit(0); 
) 


(3) init_keyboard 函 数 和 close_keyboard 函 数 分 别 在 程序 的 开始 和 结束 对 终端 进行 配置 。 
void init, keyboard() 


tcgetattr(0,&initial settings); 
new settings = initial settings; 
new settings.c lflag &e -ICANON; 
new settings.c lflag &e -ECHO; 
.clflag &= -ISIG; 
.CLCC[VMIN] = 1; 
.c_cc[VTIME] = 0; 





) 
void close keyboard) 
( 
tcsetattr(0, TCSANOW, &initial settings); 
) 


(4) 下 面 就 是 检测 是 否 有 击 键 动作 的 kbhit 函 数 : 
int kbhit() 
( 


char ch; 
int nread; 


if(peek character != -1) 

return 1; ` 
new_settings.c_cc[VMIN] =0; 
tcsetattr(0, TCSANOW, &new settings); 
nread = read(0,&ch,1); 
new settings.c cc[VMIN]-1; 
tesetattr(0, TCSANOW, &new settings); 


if(nread == 1) ( 
peek character - ch; 
return 1; 

) 

return 0; 


2 


(5) 按键 对 应 的 字符 由 下 一 个 函数 readch 读 取 , 它 会 将 变量 peek_character 重 置 为 -1 以 进入 下 一 
次 循环 。 
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int readch() 
t 
char ch; 


if(peek character !- -1) ( 
ch = peek character; 
peek character = -1; 
return ch; 
) 
read(0,&ch,1) ; 
return ch; 
) 


运行 这 个 程序 ， 你 将 看 到 如 下 的 输出 结果 
$ ./kbhit 
looping 
looping 
looping 
you hit h 
looping 
looping 
looping. 
you hit d 
looping 
you hit q 
$ 


init_keyboard 函 数 将 终端 配置 为 "read 调用 直到 有 字符 可 以 读 取 时 才 返回 ” 的 工作 模式 (MIN=1， 
TIME=0)。kbhit 函 数 将 这 个 模式 修改 为 “reaa 调 用 检查 输入 并 立刻 返回 ”的 工作 模式 (MIN=0， 
TIME=0)。 最 后 ， 在 程序 退出 前 恢复 终端 的 初始 设置 

注意 ， 在 kbhit 函 数 中 ， 你 实际 上 已 将 按键 对 应 的 字符 读 取 了 ， 但 它 只 在 需要 时 才 通过 readch 函 
数 返 回 。 





57 ”虚拟 控制 台 


Linux 提 供 了 虚拟 控制 台 的 功能 ， 一 组 终端 设备 共享 PC 电脑 的 屏幕 、 键 盘 和 鼠标 。 通 常情 况 下 
-个 Linux 安 装 将 配置 8 个 或 12 个 虚拟 控制 台 。 虚 拟 控制 台 通过 字符 设备 文件 /aev/ccyN 使 用 ， 其 中 
代表 一 个 数字 ， 从 1 开始 。 
如 果 使 用 字符 界面 登录 Linux 系 统 ， 在 Linux 启 动 并 运行 后 ， 你 首先 会 看 到 一 个 login 提 示 符 ， 在 输 
入 用 户 名 和 密码 登录 后 ， 你 所 使 用 的 终端 设备 就 是 系统 中 的 第 一 个 虚拟 控制 台 ， 即 终端 设备 


/dev/ttyl. 

使 用 命令 who 和 ps， 你 即 可 看 到 目前 登录 进 系统 的 用 户 ， 以 及 在 这 个 虚拟 控制 台 上 运行 的 shell 和 
执行 的 程序 : 

$ who 

neil ttyl Mar 8 18:27 


$ ps -e 


58 hik 173 





PID TTY TIME CMD 
1092 ttyl 00:00:00 login 
1414 ttyl 00:00:00 bash 
1431 ttyl 00:00:00 emacs 


你 可 以 看 到 用 户 neil 已 登录 进 系统 ， 并 在 虚拟 控制 台 /aev/tty1 上 运行 程序 enacs。 
Linux 系 统 通常 在 前 6 个 虚拟 控制 台 上 运行 一 个 getty 进 程 ， 这 样 用 户 即 可 用 同一 个 屏幕、 键盘 和 
鼠标 在 6 个 不 同 的 虚拟 控制 台 上 登录 。 你 可 以 用 ps 命令 看 到 getty 进 程 : 
pec 
pm TIME CHD 
1092 ttyl 00:00:00 login 
1093 tty2 
1094 tty3 
1095 tty4 
1096 tty5 





户 的 登录 。 

你 可 以 通过 一 个 特殊 的 组 合 键 Ctrl+Alt+F<N> 在 不 同 的 虚拟 控制 台 之 间 进行 切换 ， 其 中 N 是 你 希望 
切换 到 的 虚拟 控制 台所 对 应 的 数字 。 例 如 ， 如 果 想 切换 到 第 2 个 虚拟 控制 台 ， 你 就 按 下 组 合 
Alt+CtritF2， 按 下 组 合 键 Ctrlt+AlttF1 将 返回 到 第 一 个 虚拟 控制 台 。( 注 意 ， 当 在 字符 界面 而 不 是 图 形 
界面 进行 虚拟 控制 台 的 切换 时 ， 需 要 使 用 组 合 键 AlttF<N>?。) 

如 果 Linux 系 统 使 用 的 是 图 形 登录 界面 ， 例 如 通过 startx 程 序 或 通过 视窗 管理 器 xam，X 视 窗 系统 
将 使 用 第 一 个 未 使 用 的 虚拟 控制 台 ， 通 常 是 /dev/tty7。 在 使 用 X 视 窗 系统 时 ， 你 可 以 用 组 合 
CtrltAlttF<N> 切 换 到 字符 控制 台 ， 用 组 合 键 Ctri+Alt+F7 切 换 回 X 视 窗 系统 。 

你 可 以 同时 在 Linux 系 统 上 运行 多 个 X 视 窗 会 话 ， 如 下 所 示 : 

$ startx -- :1 

Linux 将 在 下 一 个 未 使 用 的 虚拟 控制 台 上 启动 X 服 务 器 ， 在 此 例 中 ， 下 一 个 未 使 用 的 控制 台 是 
/aev/tty8， 然 后 ， 你 即 可 用 组 合 键 Ctrl+Alt+tF8 和 Ctrl+Alt+F7 在 两 个 虚拟 控制 台 之 间 进 行 切换 。 

在 其 他 方面 ， 虚 拟 控制 台 的 行为 都 与 普通 硬件 终端 一 样 。 如 果 一 个 进程 拥有 正确 的 权限 ， 它 即 可 
打开 一 个 虚拟 控制 台 ， 采 用 与 读 写 普通 硬件 终端 一 样 的 方式 对 其 进行 读 写 。 


5.8 伪 终 端 


许多 类 UNIX 系 统 ， 包 括 Linux， 都 有 一 个 被 称 为 伪 终 端的 功能 。 这 些 终端 的 行为 与 我 们 在 本 章 所 
用 的 终端 非常 相似 ， 唯 一 区 别 是 伪 终 端 没 有 对 应 的 硬件 设备 。 它 们 可 以 用 来 为 其 他 程序 提供 终端 形式 
的 接口 。 

例如 ， 两 个 象棋 程序 可 以 通过 伪 终 端 进行 对 弈 ， 尽 管 程序 本 身 是 为 与 人 类 棋 手 通过 实际 终端 进行 
对 弈 而 设计 的 。 这 需要 有 个 应 用 程序 作为 中 介 ， 它 将 一 个 程序 的 棋子 走 法 传递 给 另 一 个 程序 ， 反 之 亦 
然 。 中 介 程 序 通过 伪 终 端 来 欺骗 象棋 程序 ， 让 它 在 没有 实际 终端 的 情况 下 正常 运行 。 

过 去 ， 伪 终端 都 是 以 系统 特定 的 方式 实现 的 ， 但 现在 它们 已 被 合并 到 单一 UNIX 规 范 中 ， 称 为 


CD 原文 为 使 用 组 合 键 Crt+F<N>， 似 有 误 ， 实 际 上 , 在 使 用 字符 界面 时 ， 最 常用 的 虚拟 控制 台 切换 组 合 键 是 AlttF<N>。 
一 一 译 者 注 
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UNIX98 伪 终端 或 PTY 。 
5.9 小 结 


在 本 章 中 ， 你 学 习 了 对 终端 进行 控制 的 三 个 不 同方 面 。 在 本 章 的 第 一 部 分 ， 你 学 习 了 如 何 检测 重 
定向 ， 如 何 直接 与 终端 进行 对 话 ， 即 使 在 标准 文件 描述 符 被 重 定向 的 情况 下 。 你 了 解 了 终端 的 硬件 模 
型 及 其 历史 演变 过 程 。 接 下 来 ， 你 学 习 了 通用 终端 接口 和 termios 结 构 ， 后 者 提供 了 对 Linux 终 端 处 理 
的 细节 控制 ,你 还 学 习 了 terminfo 数 据 库 及 其 相关 函数 的 使 用 方法 , 它们 以 终端 独立 的 方式 来 管理 屏 
幕 输出 。 然 后 ， 你 学 习 了 如 何 立刻 检测 用 户 的 击 键 。 最 后 ， 你 学 习 了 Linux 的 虚拟 控制 台 和 伪 终 端 。 
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基于 文本 的 屏幕 





ire 你 学 习 了 如 何 加 强 对 字符 输入 的 控制 , 以 及 如 何以 终端 无 关 的 方式 提供 字符 输出 。 
使 用 通用 终端 接口 (GTI 或 termios) 和 通过 tparm 及 其 相关 函数 控制 escape 转 义 序列 都 存在 
-个 问题 , 那 就 是 它们 需要 使 用 大 量 的 底层 代码 。 对 大 多 数 程序 来 说 , 它们 更 需要 的 是 一 个 高 层 接口 。 

我 们 希望 能 够 简单 绘制 屏幕 ， 并 能 用 一 组 函数 自动 处 理 与 终端 相关 的 问题 。 

在 本 章 中 ， 你 就 将 学 习 函 数 库 curses。curses 标 准 作为 一 个 重要 的 过 渡 ， 位 于 简单 的 文本 行程 
序 和 完全 图 形 化 界面 一 般 也 更 难于 编程 》 的 X 视 窗 系统 程序 (如 GTK+/GNOME 和 QVKDE) 之 间 。 
Linux 还 提供 svealib 函 数 库 〈 一 个 底层 图 形 函 数 库 )， 但 它 并 不 是 UNIX 的 标准 函数 库 ， 因 此 ， 在 其 他 
类 UNIX 操 作 系统 中 一 般 并 未 提供 该 函数 库 。 许 多 全 屏幕 的 应 用 程序 都 使 用 curses 函 数 库 ， 它 易于 使 
用 ， 并 且 提供 了 终端 无 关 的 方式 来 编写 全 屏幕 的 基于 字符 的 程序 。 在 编写 这 类 程序 时 ， 使 用 curses 
函数 库 总 是 比 直 接 使 用 escape 转 义 序列 要 容易 得 多 。curses 还 可 以 管理 键盘 ， 它 还 提供 了 一 种 简单 易 
用 的 非 阻塞 字符 输入 模式 。 

读者 可 能 会 发 现 ， 在 Linux 控 制 台 上 运行 本 章 中 的 一 些 例子 时 ， 并 不 总 是 能 够 获得 预期 的 效果 。 
这 是 因为 ， 当 curses 函 数 库 和 控制 台 终 端 定义 的 结合 出 现 偏差 时 ， 使 用 curses 函 数 库 的 程序 的 输出 
结果 就 会 有 些 问题 ， 但 如 果 在 X 视 窗 系统 的 xcerm 窗 口中 运行 这 些 例子 ， 其 输出 结果 就 与 你 预期 的 完 
全 一 样 了 。 

本 章 将 介绍 以 下 儿 方面 的 内 容 : 

口 curses 函 数 库 的 使 用 

口 curses 函 数 库 的 概念 

口 基本 的 输入 输出 控制 

口 多 窗口 的 使 用 

口 keypad 模 式 的 使 用 

口 彩色 显示 

在 本 章 最 后 ， 我 们 将 用 C 语 言 重新 实现 CD 唱片 管理 程序 ， 将 其 作为 对 目前 为 止 所 学 知识 的 一 个 总 
结 


结 。 


6.1 用 curses 函数 库 进 行 编 译 


curses 函 数 库 能 够 优化 光标 的 移动 并 最 小 化 需要 对 屏幕 进行 的 刷新 , 从 而 也 减少 了 必须 向 字符 终 
端 发 送 的 字符 数目 。 虽 然 比 起 使 用 哑 终 端 和 慢 速 调 制 解 调 器 的 年 代 ， 输 出 字符 的 数量 已 显得 不 那么 重 
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要 ， 但 curses 函 数 库 仍 是 程序 员工 具 箱 中 一 个 有 用 的 工具 。 

由 于 curses 是 一 个 函数 库 ， 所 以 在 需要 使 用 它 时 ， 你 必须 在 程序 中 包含 对 应 的 头 文件 、 函 数 声明 
和 宏 定义 。curses 函 数 库 有 多 种 不 同 的 实现 版 本 ， 最 早 的 版 本 出 现在 BSD 版 本 的 UNIX 系 统 中 ， 后 来 
被 集成 到 系统 V 风 格 的 UNIX 系 统 中 ， 其 后 又 由 X/Open 组 织 对 curses 进 行 了 标准 化 。Linux 使 用 的 
curses 版 本 是 ncurses (又 称 为 new curses)， 它 是 在 Linux 系 统 上 开发 的 、 针 对 系统 V 版 本 4.0 上 curses 
函数 库 的 免费 仿真 软件 。 这 个 版 本 可 以 方便 地 移植 到 其 他 UNIX 版 本 中 ， 虽 然 它 还 包括 了 一 些 附加 的 
不 可 移植 的 功能 。 现 在 甚至 还 有 针对 MS-DOS 和 Windows 系 统 的 curses 版 本 。 如果 使 用 的 UNIX 系 统 自 
带 的 curses 函 数 库 不 支持 某 些 功能 ， 你 可 以 尝试 获取 一 份 hcurses 函 数 库 来 替换 它 。Linux 用 户 通常 
都 会 发 现 系 统 已 预 装 好 了 ncurses 函 数 库 ， 或 至 少 安装 好 了 运行 基于 curses 函 数 库 的 程序 所 需 的 组 
件 。 如 果 ncurses 的 开发 函数 库 并 没有 在 Linux 发 行 版 中 预 装 〈 系 统 中 没有 头 文件 curses.h 或 用 于 链 
接 的 curses 库 文件 ), 它们 通常 会 以 一 个 标准 软件 包 的 形式 存在 于 大 多 数 主要 的 Linux 发 行 版 中 , 例如 ， 
它 可 能 被 命名 为 libncurses5-dev。 


X/Open 规 范 定义 了 两 个 级 别 的 curses 函 数 库 : 基本 curses 函 数 库 和 扩展 curses 函 数 
库 ， 扩 展 curses 示 教 库 包含 一 组 混杂 的 附加 函数 ， 比 如 处 理 多 列 字符 和 控制 颜色 的 函数 。 
除 在 本 章 的 后 面 会 讨论 颜色 的 使 用 外 ， 我 们 主要 介绍 的 都 是 基本 curses 函 数 . 


当 对 使 用 curses 函 数 库 的 程序 进行 编译 时 ， 你 必须 在 程序 中 包含 头 文件 curses .h， 并 在 编译 命 
令 行 中 用 -lcurses 选 项 来 链接 curses 函 数 库 。 在 许多 Linux 系 统 中 ， 你 可 以 直接 使 用 curses， 但 你 会 
发 现实 际 使 用 的 是 更 好 的 、 更 新 的 ncurses 实 现 版 本 。 

你 可 以 检查 自己 的 curses 的 配置 情况 ， 命 令 

1s -1 /usr/include/*curses.h 
用 来 查看 curses 头 文件 ， 命 令 

ls -1 /usr/lib/lib*curses* 

用 来 检查 库 文件 。 如 果 发 现 头 文件 curses.h 和 ncurses.h 都 只 是 链接 文件 ， 而 且 系 统 中 存在 一 个 
ncurses 库 文件 ， 那 么 你 就 可 以 使 用 如 下 命令 来 编译 本 章 中 的 程序 : 

$ gcc program.c -o program -lcurses 

但 如 果 curses 配 置 并 未 自动 使 用 ncurses 函 数 库 ， 那 么 你 可 能 不 得 不 在 程序 中 明确 包含 头 文件 
ncurses.h 而 不 是 curses.h 来 强制 使 用 ncurses 函 数 库 ， 同 时 需要 执行 如 下 的 编译 命令 : 

$ gcc -I/usr/include/ncurses program.c -o program -lncurses 
其 中 ，-I 选 项 用 于 指定 搜索 头 文件 的 目录 。 

在 可 下 载 的 源 代码 中 包含 的 Makefile 文 件 默认 会 假设 你 的 配置 使 用 的 是 curses， 如 果 你 

的 系统 不 是 这 种 情况 ， 你 必须 修改 该 文件 或 手工 编译 本 章 的 程序 。 

如 果 不 能 确认 你 的 系统 中 的 curses 究 竟 是 如 何 配置 的 ， 你 可 以 参考 ncurses 的 手册 页 或 查看 其 他 
在 线 文档 , 常见 的 在 线 文档 目录 位 于 /usr/share/Goc/ 之 下 .在 该 目录 中 , 你 会 发 现 curses 或 ncurses 
子 目 录 ， 通 常 在 该 名 称 后 面 还 会 附加 版 本 号 。 


6.2 curses 术语 和 概念 
curses 例 程 工作 在 屏幕 、 窗 口 和 子 窗口 之 上 。 所 谓 屏幕 就 是 你 正在 写 的 设备 (通常 是 终端 屏幕 ， 
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也 可 能 是 xterm 屏 幕 )。 屏 幕 占据 了 设备 上 全 部 的 可 用 显示 面积 ， 当 然 ， 如 果 设 备 是 X 视 窗 中 的 一 个 终 
端 窗口 ， 则 屏幕 就 是 该 终端 窗口 内 所 有 可 用 的 字符 位 置 。 无 论 何 时 ， 至 少 存在 一 个 curses 窗 口 ， 我 们 
称 之 为 stdscr， 它 与 物理 屏幕 的 尺寸 完全 一 样 。 你 可 以 创建 一 些 尺寸 小 于 该 屏幕 的 窗口 ， 窗 口 可 以 互 
相 重 登 ， 它 们 还 可 以 拥有 自己 的 多 个 子 窗口 ， 但 每 个 子 窗口 必须 总 是 被 包含 在 它 的 父 窗口 内 。 

curses 函 数 库 用 两 个 数据 结构 来 映射 终端 屏幕 ， 它 们 是 stascr 和 curscr。 两 者 中 ，stascr 更 重 
要 一 些 ， 它 会 在 curses 函 数 产生 输出 时 被 刷新 。stascr 数 据 结 构 对 应 的 是 “标准 屏幕 ”， 它 的 工作 方 
式 与 stdio 函 数 库 中 的 标准 输出 staout 非 常 相似 它 是 curses 程 序 中 的 默认 输出 窗口 。curscr 数 据 结 
构 和 stdscr 相 似 ， 但 它 对 应 的 是 当前 屏幕 的 样子 。 在 程序 调用 refresh 函 数 之 前 ， 输 出 到 stascr 上 的 
内 容 不 会 显示 在 屏幕 上 。curses 函 数 库 会 在 refresh 函 数 被 调用 时 比较 stdscr( 屏 幕 将 会 是 什么 样子 
与 第 二 个 数据 结构 curscr (屏幕 当前 的 样子 ) 之 间 的 不 同 之 处 ,然后 用 这 两 个 数据 结构 之 间 的 差异 来 
刷新 屏幕 。 

有 的 curses 程 序 需要 知道 curses 维 护 的 stascr 结 构 ， 因 为 有 些 curses 函 数 需要 以 该 结构 为 参 
数 。 但 真正 的 stascr 结 构 是 与 具体 实现 相关 的 ， 它 决 不 能 被 直接 访问 。curses 程 序 无 需 使 用 curscr 
数据 结构 。 

综 上 所 述 ， 在 curses 程 序 中 输出 字符 的 过 程 如 下 所 示 。 

(1) 使 用 curses 函 数 刷新 逻辑 屏幕 。 

(2) 要 求 curses 用 refresh 函 数 来 剧 新 物理 屏幕 。 

除了 易于 编程 以 外 ， 分 成 两 个 步骤 来 完成 字符 输出 的 好 处 还 在 于 ，curses 屏 幕 的 刷新 效率 很 高 。 
虽然 这 点 对 控制 台 屏幕 来 说 并 不 重要 ， 但 如 果 你 是 通过 慢 速 网 络 连接 到 主机 上 来 运行 程序 ， 则 屏 蒂 刷 
新 效率 的 提高 意义 就 很 大 了 。 

-个 curses 程 序 会 多 次 调用 逻辑 屏幕 输出 函数 , 例如 在 屏幕 上 移动 光标 到 达 正 确 的 位 置 ,然后 输 
出 文本 、 绘 制 线 框 。 在 程序 执行 的 某 些 阶 段 ， 用 户 需要 看 到 全 部 的 
输出 结果 。 这 时 curses 一 般 会 通过 调用 refresh 函 数 计算 出 让 物理 
屏幕 和 远 辑 屏幕 相对 应 的 最 佳 途径 。curses 通 过 使 用 合适 的 终端 功 
能 标志 及 优化 光标 的 移动 来 剧 新 屏幕 ， 与 立刻 执行 所 有 的 屏幕 写 操 
作 相 比 ，curses 所 需要 输出 的 字符 要 少 得 多 。 

多 辑 屏 幕 的 布局 通过 一 个 字符 数组 来 实现 ， 它 以 屏幕 的 左上 
角 一 坐标 《0,0) 为 起 点 ， 通 过 行 号 和 列 号 来 组 织 ， 如 图 6-1 所 示 。 

所 有 的 curses 函 数 使 用 的 坐标 都 是 y 值 行 号 ) 在 前 、x 值 ( 列 
号 ) 在 后 。 每 个 位 置 不 仅 包含 该 屏幕 位 置 处 的 字符 ， 还 包含 它 的 属 
性 。 可 显示 的 属性 依赖 物理 终端 的 功能 标志 ， 但 一 般 至 少 会 支持 粗 
体 和 下 划 线 这 两 个 属性 .Linux 控 制 台 通常 还 支持 反 白 显示 和 色彩 属 
性 ， 后 面 将 介绍 这 方面 的 内 容 。 m ei 

由 于 curses 函 数 库 在 使 用 时 需要 创建 和 删除 一 些 临时 的 数据 结构 ， 所 以 所 有 的 curses 程 序 必须 
在 开始 使 用 curses 函 数 库 之 前 对 其 进行 初始 化 ， 并 在 结束 使 用 后 允许 curses 恢 复原 先 设置 。 这 两 项 
工作 是 由 initscr 和 endwin 函 数 分 别 完成 的 。 


gE- “Hello World" curses 程 序 


在 本 例 中 ， 你 将 编写 一 个 非常 简单 的 curses 程 序 screen1.c， 来 显示 这 些 及 其 他 一 些 基本 函数 的 
使 用 方法 。 然 后 我 们 再 介绍 它们 的 函数 原型 
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(1) 在 程序 里 加 上 curses .h 头 文件 ， 在 main 函 数 中 增加 初始 化 和 重 置 curses 库 的 函数 调用 : 


#include <unistd.h> 
#include <stdlib.h> 
#include «curses.h» 


int main() { 
initscr(); 


endwin(); 
exit(EXIT SUCCESS) ; 
) 
(2) 在 初始 化 和 重 置 操作 之 间 , 增加 将 光标 移动 到 逻辑 屏幕 上 坐标 (5,15) 处 、 输出 “Hello World", 
然后 刷新 物理 屏幕 的 代码 。 最 后 ， 调 用 函数 sleep(2) 将 程序 暂停 两 秒 钟 ， 以 便 在 程序 结束 前 看 到 输出 
的 结果 : 


move(5, 15); 
printw(*&s*, "Hello World"); 
refresh(); 


sleep(2); 
运行 程序 时 ， 你 将 在 空白 屏幕 的 左上 部 分 看 到 “Hello World” 字 符 串 ， 如 图 6-2 所 示 。 


metto worta 








图 6-2 
ANRUF lacur sosif RUE, MOEEHEIBIDERE LURAR, AEREA, MEHA 
后 ， 它 关闭 curses 函 数 库 并 退出 





6.3 屏幕 


正如 你 所 看 到 的 ， 所 有 的 curses 程 序 必须 以 initscr 函 数 开始 ， 以 endwin 函 数 结束 。 下面 是 它们 
的 头 文件 定义 : 


63 AX 179 





#include «curses.h» 

WINDOW *initscr(void); 

int endwin(void); 

initscr 函 数 在 一 个 程序 中 只 能 调用 一 次 。 如 果 成 功 ， 它 返回 一 个 指向 stdscr 结 构 的 指针 ; 如果 
失败 ， 它 就 输出 一 条 诊断 错误 信息 并 使 程序 退出 。 

endwin 函 数 在 成 功 时 返回 ok， 失 败 时 返回 ERR。 你 可 调用 enGwin 函 数 退 出 curses, 然后 通过 
调用 clearok (stdscr,1) 和 refresh 函 数 继续 curses 操 作 。 这 实际 上 是 首先 让 curses 忘 记 物 理 屏幕 
的 样子 ， 然 后 强迫 它 执行 一 次 完整 的 屏幕 原文 重 现 。 


6.3.1 输出 到 屏幕 
curses 函 数 库 提供 了 一 些 用 于 刷新 屏幕 的 基本 函数 ， 它 们 是 : 


#include <curses.h> 





int addch(const chtype char to add); 

int addchstr(chtype *const string to add); 

int printw(char *format, ...); 

int refresh(void); 

int box(WINDOW *win ptr, chtype vertical char, chtype horizontal char); 
-int insch(chtype char to insert); 


int insertin(void); 
int delch(void); 
int deleteln(void); 
int beep(void); 
int flash(void); 


curses 有 其 自己 的 字符 类 型 chtype, 它 可 能 比 标准 的 char 类 型 包含 更 多 的 二 进 制 位 。 在 ncurses 
的 标准 Linux 版 本 中 ，chtype 实 际 上 是 unsignea long 类 型 的 一 个 cypedaef 类 型 定义 。 

add 系 列 函 数 在 光标 的 当前 位 置 添加 指定 的 字符 或 字符 串 。printw 函 数 采用 与 printf 函 数 相同 的 
方法 对 字符 串 进 行 格式 化 ， 然 其 添加 到 光标 的 当前 位 置 。refresh 函 数 的 作用 是 刷新 物理 屏幕 ， 
成 功 时 返回 ok， 发 生 错 误 时 返回 ERR。box 函 数 用 来 围绕 一 个 窗口 绘制 方 框 。 


在 标准 curses 郴 数 库 中 , 垂直 和 水 平 线 字符 可 能 只 能 使 用 普通 字符 . 但 在 扩展 curses 
通 数 库 中 ， 你 可 以 利用 两 个 定义 ACS_VLINE 和 ACS_HLINE 来 分 别提 供 重 直 和 水 平 线 字符 ， 
它们 可 以 让 你 绘制 更 好 看 的 方 框 ， 但 这 需要 终端 支持 这 些 画 线 字 符 ， 一般 来 说 ， 这 个 功能 
在 xterm 窗 口中 比 在 标准 控制 台中 工作 得 更 好 ， 但 系统 对 该 功能 的 支持 往往 是 不 完整 的 ， 
所 以 如 果 需 要 考虑 程序 的 可 移植 性 ， 我 们 建议 最 好 不 要 在 程序 中 使 用 它们 . 


insch 函 数 插入 一 个 字符 ， 将 已 有 字符 向 右 移 ， 但 此 操作 对 行 尾 的 影响 并 未 定义 ， 具 体 情况 取决 
于 你 所 使 用 的 终端 。insercln 函 数 的 作用 是 插入 一 个 空白 行 , 将 现 有 行 依次 向 下 移 一 行 。 两 个 delete 
函数 的 作用 与 上 述 两 个 insert 函 数 正好 相反 。 

如 果 要 让 程序 发 出 声音 ， 你 可 以 调用 beep 函 数 。 但 因为 有 极 少 部 分 终端 不 能 发 出 声音 ， 所 以 有 些 
curses 设 置 会 在 调用 beep 函 数 时 让 屏幕 闪烁 。 如 果 你 在 一 个 比较 繁忙 的 办 公 室 上 班 ， 蜂 榴 就 可 能 产 
生 于 各 种 机 器 设备 ， 这 时 ， 你 可 能 更 愿意 选择 屏幕 闪烁 这 种 方式 。 正 如 你 预期 的 那样 ，flash 函 数 的 
作用 就 是 使 屏幕 闪烁 ， 但 如 果 无 法 产生 闪烁 效果 ， 它 将 尝试 在 终端 上 发 出 声音 。 






















180 第 6 章 使 用 curses 函数 库 管理 基于 文本 的 屏幕 





6.3.2 ”从 屏幕 读 取 


你 可 以 从 屏幕 上 读 取 字符 ， 虽 然 这 个 功能 并 不 常用 ， 因 为 一 般 来 说 ， 要 想 了 解 屏幕 上 所 写 内 容 很 
容易 。 但 如 果 需 要 该 功能 ， 可 用 下 面 这 些 函 数 实现 它 : 


#include «curses.h» 


chtype inch(void); 
int instr(char *string); 
int innstr(char *string, int number of characters); 


inch 函 数 总 是 可 用 的 , 但 instr 和 innstr 函 数 并 不 总 被 支持 。 inch 函 数 返回 光标 当前 位 置 的 字符 
及 其 属性 信息 。 注 意 ，inch 函 数 返回 的 并 不 是 一 个 字符 ， 而 是 -个 chtype 类 型 的 变量 ， 而 instr 和 
innstr 函 数 则 将 返回 内 容 写 到 字符 数组 中 。 


6.3.3 ”清除 屏幕 
清除 屏幕 上 的 某 个 区 域 主要 有 4 种 方法 ， 它 们 是 : 


#include <curses.h> 
int erase(void); 
int clear(void); 


int clrtobot(void); 
int clrtoeol(void); 


erase 函 数 在 每 个 屏幕 位 置 写 上 空白 字符 。clear 函 数 的 功能 类 似 erase 函 数 ， 它 也 是 用 于 清 屏 ; 
但 它 还 通过 在 内 部 调用 一 个 底层 函数 clearok 来 强制 重 现 屏幕 原文 。 clearok 函 数 会 强制 执行 清 屏 操 
作 ， 并 在 下 次 调用 refresh 函 数 时 重 现 屏幕 原文 。 

clear 函 数 通常 是 使 用 一 个 终端 命令 来 清除 整个 屏幕 ， 而 不 是 尝试 删除 当前 屏幕 上 每 个 非 空白 的 
位 置 。 因 此 ，clear 函 数 是 一 种 可 以 彻底 清除 屏幕 的 可 靠 方 法 。 当 屏幕 显示 变 得 混乱 时 ， clear 函 数 
和 refresh 函 数 的 结合 提供 了 一 种 有 效 的 重新 绘制 屏幕 的 手段 。 

clrtobot 函 数 清除 当前 光标 位 置 直 到 屏幕 结尾 的 所 有 内 容 。clrtoeo1 函 数 清除 当前 光标 位 置 直 
到 光标 所 处 行 行 尾 的 所 有 内 容 。 


6.3.4 ”移动 光标 
用 于 移动 光标 的 函数 只 有 1 个 ， 另 有 1 个 函数 用 来 控制 在 刷新 屏幕 后 curses 将 光标 放置 的 位 置 : 


#include <curses.h> 





int move(int new y, int new x); 
int leaveok(WINDOW *window ptr, bool leave flag); 


move 函 数 用 来 将 逻辑 光标 的 位 置 移 到 指定 地 点 。 记 住 ， 屏 幕 坐标 以 左上 角 (0,00 为 起 点 。 在 大 
多 数 curses 版 本 中 ， 有 两 个 包含 物理 屏幕 尺寸 大 小 的 外 部 整数 LINES 和 coLuMws， 它 们 可 用 于 决定 参 
数 new_y 和 new_x 的 最 大 可 取 值 。 调 用 move 函 数 本 身 并 不 会 使 物理 光标 移动 ， 它 仅 改变 逻辑 屏幕 上 的 
光标 位 置 ， 下 次 的 输出 内 容 就 将 出 现在 该 位 置 上 。 如 果 希 望 物理 屏幕 上 的 光标 位 置 在 调用 move 函 数 之 
后 立刻 有 变化 ， 就 需 在 它 之 后 立刻 调用 refresh 函 数 。 

leaveok 函 数 设置 了 一 个 标志 ， 该 标志 用 于 控制 在 屏幕 刷新 后 curses 将 物理 光标 放置 的 位 置 。 默 
认 情 况 下， 该 标志 为 false， 这 意味 着 屏幕 刷新 后 ， 硬件 光标 将 停留 在 屏幕 上 逻辑 光标 所 处 的 位 置 。 
如 果 该 标志 被 设置 为 crue， 则 硬件 光标 会 被 随机 地 放置 在 屏幕 上 的 任意 位 置 。 一 般 来 说 ， 默认 选项 更 
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符合 用 户 的 需求 ， 这 能 确保 光标 停留 在 一 个 有 意义 的 位 置 。 
6.3.5 ”字符 属性 


每 个 curses 字 符 都 可 以 有 一 些 属性 用 于 控制 该 字符 在 屏幕 上 的 显示 方式 , 前 提 是 用 于 显示 的 硬件 
设备 能 够 支持 要 求 的 属性 。 预 定义 的 属性 有 A_BLINK、A_BOLD、A_DIM、A_REVERSE、A_STANDOUT 和 
A_UNDERLINE。 你 可 以 用 下 面 这 些 函 数 来 设置 单个 属性 或 同时 设置 多 个 属性 : 

#include <curses.h> 

int attron(chtype attribute); 

int attroff(chtype attribute); 

int attrset(chtype attribute); 


int standout(void); 
int standend(void); 


attrset 函 数 设置 curses 属 性 ，attron 和 attroff 函 数 在 不 影响 其 他 属性 的 前 提 下 启用 或 关闭 指 
定 的 属性 。standout 和 stanGend 函 数 提供 了 一 种 更 加 通用 的 强调 或 “突出 ”模式 ， 在 大 多 数 终端 上 ， 
它 通常 被 映射 为 反 白 显示 。 


EUH 移动 、 插 入 和 属性 


现在 ， 你 已 掌握 了 许多 管理 屏幕 的 方法 ， 下 面 可 以 尝试 编写 一 个 更 复杂 的 例子 moveadd.c 了 。 你 
将 在 程序 中 包含 多 个 对 refresh 和 sleep 函 数 的 调用 ， 以 便 了 解 在 程序 执行 的 每 个 阶段 屏幕 的 显示 情 
况 。 一 般 情况 下 ，curses 程 序 会 尽 可 能 少 地 刷新 屏幕 ， 因 为 这 并 不 是 一 种 很 有 效 的 操作 。 这 里 的 代码 
主要 是 方便 演示 。 

(1) 在 程序 的 开始 包含 一 些 必要 的 头 文件 ， 定 义 几 个 字符 数组 和 一 个 指向 这 些 数组 的 指针 ， 然 后 
对 curses 结 构 进行 初始 化 : 

#include <stdio.h> 

#include <unistd.h> 

#include <stdlib.h> 


#include <string.h> 
#include <curses.h> 








int main() 

t 
const char witch one[] = * First Witch *; 
const char witch two[] = " Second Witch *; 
const char *scan ptr; 


initscr(); 
(2) 现在 是 最 初 要 显示 的 3 组 文本 ， 它 们 会 以 1 秘 为 间隔 依次 显示 在 屏幕 上 。 请 注意 对 文本 属性 标 

志 的 开关 : 

move(5, 15); 

attron(A BOLD); 

printw(*$s*, "Macbeth*); 

attroff(A BOLD); 

refresh(); 
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sleep(1); 


move(8, 15); 

attron(A STANDOUT); 

printw('$s*, "Thunder and Lightning"); 
attroff(A STANDOUT); 

refresh(); 

sleep(1); 


move(10, 10); 

printw('ts*, "When shall we three meet again"); 
move(11, 23); 

printw(*$s*, "In thunder, lightning, or in rain ?*); 
move(13, 10); 

printw('ts*, "When the hurlyburly's done,"); 
move(14,23); 

printw("$s*, "When the battle's lost and won.*); 
refresh(); 

sleep(1); 


(3) 确定 演员 并 将 他 们 的 名 字 以 一 次 一 个 字符 的 方式 插入 到 指定 的 位 置 : 


attron(A DIM); 
Scan ptr = witch one + strlen(witch one) - 1; 
while(scan ptr !- witch one) ( 

move(10,10); 

insch(*scan ptr--); 


Scan ptr = witch two + strlen(witch two) - 1; 
while (scan ptr !- witch two) ( 
move(13, 10); 
insch(*scan ptr--); 
) 
attroff(A DIM); 
refresh(); 
sleep(1); 


(4) 最 后 ， 将 光标 移动 到 屏幕 的 右 下 角 ， 然 后 结束 程序 ， 
move(LINES - 1, COLS - 1); 


refresh(); 
sleep(1); 


endwin(); 
exit(EXIT SUCCESS); 
) 
当 运 行 这 个 程序 时 ， 最 终 的 屏幕 如 图 6-3 所 示 。 
糟 料 的 是 ， 这 里 的 屏幕 截图 并 未 很 好 地 表现 出 屏幕 完整 的 效果 ， 它 也 未 能 显示 出 光标 的 位 置 ， 光 
标的 位 置 应 该 在 屏幕 的 右 下 角 。 
你 可 能 会 发 现 ， 与 标准 控制 台 相 比 ，xterm 能 更 加 准确 、 可 靠 地 显示 curses 程 序 的 输出 效果 。 
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First witen when shatt we three meet again 
Tn thunder, Lightning, or in rain 7 


Second Wateh when the hurtyburiy's donc, 
vien the battla s lost and won. 








图 63 
在 初始 化 一 些 变量 和 curses 屏 将 之 后 ， 使 用 nove 函 数 在 屏 将 上 移动 光标 。 通过 attron 和 attroff 
函数 来 控制 显示 在 屏幕 上 指定 位 置 的 文本 的 属性 。 然 后 ， 程 序 使 用 insch 函 数 米 演示 如 何 插入 字符 。 






最 后 ， 程 序 关 闭 curses 函 数 Re 
64 键盘 

curses 函 数 库 不 仅 提供 了 控制 屏幕 显示 的 易 用 接口 ， 还 提供 了 控制 键盘 的 简单 方法 。 
64.1 键盘 模式 


键盘 读 取 例 程 由 键盘 模式 控制 。 用 于 设置 键盘 模式 的 函数 有 ; 


#include «curses.h» 


int echo(void); 
int noecho(void); 
int cbreak(void); 
int nocbreak(void); 
int raw(void); 

int noraw(void); 


两 个 echo 函 数 用 于 开启 或 关闭 输入 字符 的 回 显 功能 。 其 余 4 个 函数 调用 用 于 控制 在 终端 上 输入 的 
字符 传送 给 curses 程 序 的 方式 。 

为 解释 清楚 cbreak 函 数 的 作用 ， 你 需要 首先 理解 何 为 默认 输入 模式 。 当 curses 程 序 通过 调用 
initscr 函 数 开始 运行 时 ， 输 入 模式 被 设置 为 预 处 理 模式 或 称 为 cooked 模 式 )。 这 意味 着 所 有 处 理 者 
是 基于 行 的 ,也 就 是 说 ,只 有 在 用 户 按 下 回 车 键 之 后 , 输入 的 数据 才 会 被 传送 给 程序 。 在 这 种 模式 下， 
键盘 特殊 字符 被 启用， 所 以 按 下 合适 的 组 合 键 即 可 在 程序 中 产生 一 个 信号 ， 如 果 是 通过 串 行 口 或 调制 
解 调 器 等 连接 终端 ， 则 流 控 也 处 于 启用 状态 。 程 序 可 通过 调用 cbreak 函 数 将 输入 模式 设置 为 cbreak 模 
式 ， 在 这 种 模式 下 ， 字 符 一 经 键入 就 被 立刻 传递 给 程序 ， 而 不 像 在 cooked 模 式 中 那样 首先 缓存 字符 ， 
直到 用 户 按 下 回 车 键 后 才 将 用 户 输入 的 字符 传递 给 程序 。cbreak 模 式 与 cooked 模 式 一 样 ， 键 盘 特 殊 字 
符 也 被 启用 ， 但 一 些 简 单 的 特殊 字符 ， 如 退 格 键 Backspace 会 被 直接 传递 给 程序 处 理 ， 所 以 如 果 想 让 
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退 格 键 保留 原来 的 功能 ， 你 就 必须 自己 在 程序 中 实现 它 。 

raw 函 数 调用 的 作用 是 关闭 特殊 字符 的 处 理 ， 所 以 执行 该 函数 调用 后 ， 再 想 通过 输入 特殊 字符 序 
列 来 产生 信号 或 进行 流 控 就 不 可 能 了 。 nocbreak 函 数 调用 将 输入 模式 重新 设置 为 cooked 模 式 , 但 特殊 
字符 的 处 理 方式 保持 不 变 。noraw 函 数 调用 同时 恢复 cooked 模 式 和 特殊 字符 处 理 功能 。 


6.4.2 键盘 输入 
读 取 键 盘 输入 非常 简单 ， 主 要 的 函数 有 : 


#include <curses.h> 
int getch(void); 
int getstr(char *string); 


int getnstr(char *string, int number of characters); 
int scanw(char *format, ...); 


这 些 函数 的 行为 与 它们 的 非 curses 版 本 getchar、gets 和 scanf 非 常 相似 。 要 注意 的 是 ，getstr 
函数 对 其 返回 的 字符 串 的 长 度 没有 限制 ， 所 以 使 用 这 个 函数 时 要 非常 小 心 。 如 果 所 使 用 的 curses 版 本 
支持 getnstr 函 数 〈 它 可 以 对 读 取 的 字符 数目 加 以 限制 )， 你 就 应 该 尽 可 能 地 用 它 来 兰 代 getstr 函 数 。 
这 与 你 在 第 3 章 中 看 到 的 gets 和 fgets 函 数 非常 类 似 。 

下 面 是 一 个 短小 的 示例 程序 ipmode.c， 它 演示 了 如 何 处 理 键盘 。 


ETETA 


(1) 首先 ， 设 置 程序 并 执行 初始 化 curses 函 数 库 的 调用 : 


#include <unistd.h> 
#include «stdlib.h» 
#include «curses.h» 
#include <string.h> 





#define PW_LEN 256 
#define NAME LEN 256 


int main() ( 
Char name[NAME LEN]; 
char password[PW LEN]; 
Const char *real password = "xyzzy'; 
int i = 0; 


initscr(); 


move(5, 10); 
printw(*$s", "Please login:*); 


move(7, 10); 
printw(*$s", "User name: *); 
getstr (name) ; 


move(8, 10); 
printw(*ts', "Password: *); 
refresh(); 


65 Wu 185 





(2) 用 户 输入 密码 时 ， 你 不 能 让 密码 回 显 在 屏幕 上 。 然 后 , 检查 用 户 输入 的 密码 是 否 等 于 xyzzy: 


cbreak(); 
noecho(); 


memset(password, 'X0', sizeof (password) ); 
while (i < PW LEN) { 

password[i] = getch(); 

if (password[i] == 'Wn') break; 

move(8, 20 « i); 

addch('*'); 

refresh(); 

ies 


) 
(3) 最 后 ， 重 新 启用 键盘 回 显 , 并 给 出 密码 验证 成 功 或 失败 的 信息 : 


echot); 
nocbreak(); 


move(11, 10); 

if (strncmp(real password, password, strlen(real password)) == 0) 
printw(*$s"*, "Correct*); 

else printw(*$s*, "Wrong*); 

printw(*$s*, " password"); 

refresh(); 

sleep(2); 


endwin(); 
exit(EXIT SUCCESS); 


) 
关闭 键盘 输入 回 显 并 将 输入 模式 设置 为 cbreak 后 ， 你 设置 一 块 内 存 区 域 用 于 接收 用 户 输入 的 密 
码 。 每 个 输入 的 密码 字符 被 立即 处 理 并 在 屏幕 的 下 一 个 位 置 上 显示 一 个 * 号 。 你 需要 在 每 次 输出 * 号 后 
刷新 屏幕 ， 然 后 ， 用 scrncmp 函 数 来 比较 用 户 输入 的 密码 和 保存 在 程序 中 的 正确 密码 。 
如 果 使 用 的 curses 函 数 库 版 本 很 老 ， 你 可 能 需要 在 gerstr 函 数 调 用 之 前 加 上 一 个 
refresh 函 数 调用 。 在 ncurses 版 本 中 ，getscr 函 数 调用 会 自动 刷新 屏幕 . 





65 窗口 


到 目前 为 止 ， 你 一 直 将 终端 用 作为 一 个 全 屏幕 的 输出 介质 。 对 短小 、 简 单 的 程序 来 说 ， 这 样 做 一 
般 已 足够 了 , 但 curses 函 数 库 的 功能 远 不 止 如 此 . 你 可 以 用 curses 函 数 库 在 物理 屏幕 上 同时 显示 多 个 
不 同 尺寸 的 窗口 。 本 节 中 介绍 的 许多 函数 只 被 X/Open 规 范 定义 的 扩展 curses 函 数 库 支 持 ， 但 因为 
ncurses 函 数 库 也 支持 它们 ， 记 以 在 大 多 数 平 台中 使 用 它们 并 不 会 出 现 问题 。 现 在 是 时 候 开 始 学 习 多 
窗口 的 使 用 方法 了 。 你 还 将 看 到 如 何 将 所 使 用 的 这 些 函 数 通 用 化 ， 并 应 用 到 多 窗口 的 情况 下 。 


6.5.1 WINDOW 结构 
虽然 前 面 已 介绍 过 标准 屏幕 scascr， 但 目前 为 止 ， 你 几乎 没有 使 用 它 的 必要 。 因 为 ， 几 乎 所 有 我 
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们 前 面 讨论 过 的 函数 都 假设 它们 工作 在 scascr 之 上 ， 因 此 ，stascr 无 需 作为 一 个 参数 传递 给 这 些 函 
Lo 
标准 屏幕 stascr 只 是 wINDOw 结 构 的 一 个 特例 ， 就 像 标准 输出 staout 是 文件 流 的 一 个 特例 一 样 。 
WINDOW 结 构 通常 定义 在 头 文件 curses.h 中 ， 虽 然 研究 该 结构 是 有 意义 的 ， 但 程序 应 该 永远 都 不 要 直 
接 访问 它 ， 因 为 该 结构 在 不 同 的 curses 版 本 中 的 实现 方式 不 同 。 

你 可 以 用 函数 调用 newwin 和 aelwin 来 创建 和 销毁 窗口 ， 

#include «curses.h» 

WINDOW *newwin(int num of lines, int num of cols, int start y, int start x); 

int delwin(WINDOW *window to delete); 

newwin 函 数 的 作用 是 创建 一 个 新 窗口 ， 该 窗口 从 屏幕 位 置 Cstart y. start oO 开始 ， 行 数 和 
列 数 分 别 由 参数 num_of_lines 和 num_of_cols 指 定 。 它 返回 一 个 指向 新 窗口 的 指针 , 如 果 新 窗口 创建 
失败 则 返回 nul1。 如 果 想 让 新 窗口 的 右 下 角 正 好 落 在 屏幕 的 右 下 角 上 ， 你 可 以 将 该 函数 的 行 、 列 参数 
设 为 0。 所 有 的 窗口 范围 都 必须 在 当前 屏幕 范围 之 内 ， 如 果 新 窗口 的 任何 部 分 落 在 当前 屏幕 范围 之 外 ， 
则 newwin 函 数 调用 将 失败 。 通 过 newwin 函 数 创建 的 新 窗口 完全 独立 于 所 有 已 存在 的 窗口 。 默 认 情况 
下 ， 它 被 放置 在 任何 已 有 窗口 之 上 ， 履 盖 〈 但 不 是 改变 ) 它们 的 内 容 。 

delwin 函 数 的 作用 是 删除 一 个 先前 通过 newwin 函 数 创建 的 窗口 。 因 为 调用 newwin 函 数 可 能 会 给 
新 窗口 分 配 内存 ， 所 以 当 不 再 需要 这 些 窗口 时 ， 不 要 忘记 通过 aelwin 函 数 将 其 删除 。 


[注意 ， 千 万 不 要 党 斌 删除 curses 自 己 的 窗口 atascr 和 curscrl 


创建 新 窗口 后 ， 怎 样 才能 对 它们 进行 写 操作 呢 ? 答案 是 ， 几 乎 所 有 你 已 见 过 的 函数 都 有 对 应 特定 
窗口 进行 操作 的 通用 版 本 ， 并 且 为 方便 用 户 的 使 用 ， 它 们 还 都 具备 光标 移动 的 功能 。 


6.52 通用 函数 


你 已 使 用 过 函数 aaach 和 printw 在 屏幕 上 增加 字符 。 这 两 个 函数 ， 包 括 其 他 一 些 函数 ， 都 可 以 通 
过 加 上 一 些 前 组 变 为 通用 函数 。 前 级 w 用 于 窗口 、mv 用 于 光标 移动 、mvw 用 于 在 窗口 中 移动 光标 。 如 果 
查看 大 多 数 curses 函 数 库 实现 中 的 curses 头 文件 ， 你 会 发 现 你 所 使 用 过 的 许多 函数 都 只 是 调用 这 些 
通用 函数 的 简单 的 宏 定义 〈#aefine 语 句 )。 

如 果 给 函数 增加 了 w 前 组 ， 就 必须 在 该 函数 的 参数 表 的 最 前 面 增加 一 个 wINDOw 指 针 参 数 。 如 果 给 
函数 增加 的 是 mv 前 绥 ， 则 需要 在 函数 的 参数 表 的 最 前 面 增加 两 个 参数 ， 分 别 是 纵 坐 标 y 和 横 坐 标 x， 这 
两 个 坐标 值 指定 了 执行 操作 的 位 置 。 坐 标 值 y 和 x 是 相对 于 窗口 而 不 是 相对 于 屏幕 的 ， 坐 标 (0,0) 代 表 窗 
口 的 左上 角 。 

如 果 给 函数 增加 了 mvw 前 组 ， 就 需要 多 传递 3 个 参数 ， 它 们 分 别 是 一 个 WINDOw 指 针 、y 和 x 坐 标 值 。 
让 人 困惑 的 是 ，wINDOwS 指 针 参 数 总 是 出 现在 屏幕 坐标 值 之 前 ， 虽 然 从 前 组 的 写法 来 看 ，y 和 x 参 数 应 
是 首先 出 现 的 。 

作为 一 个 例子 ， 下 面 列 出 了 函数 adach 和 princw 的 所 有 原型 定义 集 : 


#include «curses.h» 

















int addch(const chtype char); 

int waddch(WINDOW *window pointer, const chtype char) 

int mvaddch(int y, int x, const chtype char); 

int mvwaddch(WINDOW *window pointer, int y, int x, const chtype char); 
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int printw(char *format, ...); 

int wprintw(WINDOW *window pointer, char *format, ...); 

int mvprintw(int y, int x, char *format, ...); 

int mvwprintw(WINDOW *window pointer, int y, int x, char *format, ...); 


其 他 许多 函数 ， 例 如 inch， 也 有 加 上 诸如 mv 和 w 前 级 的 通用 函数 。 
6.5.3 ”移动 和 更 新 窗口 
通过 下 面 这 些 函 数 ， 你 可 以 移动 和 重新 绘制 窗口 : 


#include «curses.h» 


int mvwin(WINDOW *window to move, int new y, int new x); 
int wrefresh(WINDOW *window ptr); 

(WINDOW *window ptr); 

(WINDOW *window ptr); 

int touchwin(WINDOW *window ptr); 

int scrollok(WINDOW *window ptr, bool scroll flag); 

int scroll(WINDOW *window ptr); 


mvwin 函 数 的 作用 是 在 屏幕 上 移动 一 个 窗口 。 因 为 不 允许 窗口 的 任何 部 分 超出 屏幕 范围 ， 所 以 如 
果 在 调用 mvwin 函 数 时 ， 将 窗口 的 某 个 部 分 移动 到 屏幕 区 域 之 外 ，mvwin 函 数 调用 将 会 失败 。 

wrefresh、 wclear 和 werases 函 数 分 别 是 前 面 介绍 的 refresh、clear 和 erases 函 数 的 通用 版 本 。 
它们 只 是 多 了 一 个 wINDOw 指 针 参数 ， 从 而 可 针对 特定 的 窗口 进行 操作 ， 而 不 仅仅 局 限于 scascr。 

touchwin 函 数 非常 特殊 ， 它 的 作用 是 通知 curses 函 数 库 其 指针 参数 指向 的 窗口 内 容 已 发 生 改变 。 
这 就 意味 着 ， 在 下 次 调用 wrefresh 函 数 时 ，curses 必 须 重新 绘制 该 窗口 ， 即 使 用 户 实际 上 并 未 修改 
该 窗口 中 的 内 容 。 当 屏幕 上 重 登 着 多 个 窗口 时 ， 你 可 以 通过 该 函数 来 安排 要 显示 的 窗口 。 

两 个 scrol1 函 数控 制 窗 口 的 卷 屏 。 如 果 传 递 给 scrollok 函 数 的 是 布尔 值 tcrue (通常 是 非 零 值 )， 
则 允许 窗口 卷 屏 。 而 默认 情况 下 ， 窗 口 是 不 能 卷 屏 的 。scrol1 函 数 的 作用 只 是 把 窗口 内 容 上 卷 一 行 。 
- 些 curses 函 数 库 的 实现 版 本 中 还 有 函数 wsct1， 它 有 一 个 指定 卷 行 行 数 的 参数 ， 而 且 该 参数 还 可 以 
指定 为 负 值 。 我 们 将 在 本 章 的 稍 后 部 分 再 次 讨论 卷 屏 问题 。 


实 验 管理 多 窗口 


现在 ， 你 已 知道 如 何 管理 多 个 窗口 了 ， 接 下 来 ， 你 可 以 把 刚 学 到 的 这 些 新 函数 应 用 在 程序 
multiwl.c 中 。 为 简洁 起 见 ， 在 程序 中 忽略 了 错误 检查 。 

(1) 与 往常 一 样 ， 我 们 先 安排 好 各 种 定义 : 

#include «unistd.h» 


#include <stdlib.h> 
#include «curses.h» 



















int main() 

( 
WINDOW *new window ptr; 
WINDOW *popup window ptr; 
int x loop; 
int y loop; 
Char a letter = 'a'; 


initscr(); 
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(2) 然后 ， 用 字符 填充 基本 窗口 ， 填 充 完 远 辑 屏 幕后 就 开始 刷新 物理 屏幕 : 


move(5, 5); 
printw('$s*, "Testing multiple windows"); 
refresh(); 


for (y loop = 0; y loop < LINES - 1; y loope*) ( 
for (x loop = 0; x loop < COLS - 1; x loope*) ( 
mvwaddch(stdscr, y loop, x loop, a letter); 
a lettere*; 
if (a letter > 'z') a letter = 'a'; 


} 


/* Update the screen */ 
refresh); 
sleep(2); 
(3) 现在 ， 创 建 一 个 尺寸 为 10X20 的 新 窗口 ， 为 它 添加 一 些 文本 ， 然 后 将 该 窗口 绘制 到 屏幕 上 ; 
new window ptr = newwin(10, 20, 5, 5); 
mvwprintw(new window ptr, 2, 2, "$s*, "Hello World*); 
mvwprintw(new window ptr, 5, 2, "8s", 
"Notice how very long lines wrap inside the window"); 
wrefresh(new window ptr); 
sleep(2); 
(4) 接 下 来 ， 对 背景 窗口 中 的 内 容 做 些 修改 。 当 再 次 刷新 屏幕 时 ，new_window_ptr 指 向 的 窗口 将 
BEME: 
a_letter = '0'; 
for (y_loop = 0; y_loop < LINES -1; y_loop++) ( 
for (x loop = 0; x loop < COLS - 1; x_loop++) ( 
mvwaddch(stdscr, y loop, x loop, a letter); 
a lettere; 
if (a letter > '9') 
a letter = '0'; 


) 
refresh(); 
sleep(2); 
(5) 此 时 ,如 果 调 用 wrefresh 来 刷新 新 窗口 , 则 什么 也 不 会 发 生 , 因为 你 并 未 对 新 窗口 做 过 改动 : 
wrefresh (new window ptr); 
sleep(2); 
(6) 但 如 果 先 对 新 窗口 调用 一 次 couchwin 函 数 ， 让 curses 误 以 为 新 窗口 中 的 内 容 已 发 生变 化 ， 则 
下 一 个 wrefresh 函 数 调用 将 再 次 把 新 窗口 调 到 屏幕 的 最 前 面 : 


touchwin (new_window_ptr); 
wrefresh(new window ptr); 
sleep(2); 


(7) 接 下 来 ， 再 增加 另 一 个 加 框 的 重 又 窗口 : 
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popup window ptr = newwin(10, 20, 8, 8); 

box(popup window ptr, '|', '-'); 
mvwprintw(popup window ptr, 5, 2, "ès", "Pop Up Window!*]; 
wrefresh(popup window ptr); 

sleep(2); 


(8) 然后 ， 在 清 屏 和 删除 这 两 个 新 窗口 之 前 在 屏幕 上 轮流 显示 它们 ; 


touchwin (new window ptr); 
wrefresh(new window ptr); 
sleep(2); 

wclear (new_window_ptr) ; 
wrefresh(new window ptr); 
sleep(2); 

delwin(new window ptr); 
touchwin (popup window ptr); 
wrefresh(popup window ptr); 
s1eep(2); 

delwin (popup window ptr); 
touchwin (stdscr) ; 
refresh(); 

$1eep(2); 

endwin(); 

exit(EXIT SUCCESS); 





) 


gre Ae, 我 们 无 法 让 读者 在 书 中 看 到 这 一 切 发 生 的 过 程 。 图 6-4 显 示 了 绘制 第 一 个 弹出 窗口 后 的 
屏幕 截图 。 
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H 64 
在 改变 背景 窗口 后 ， 在 屏幕 上 又 绘制 了 一 个 弹出 窗口 ， 这 时 屏幕 的 显示 如 图 6-5。 


实验 解析 
在 通常 的 初始 化 过 程 之 后 ， 程 序 使 用 字母 填充 标准 屏幕 ， 以 便 用 户 看 到 添加 在 其 上 的 新 curses 
窗口 。 然 后 ， 程 序 演示 了 如 何在 背景 之 上 添加 一 个 新 窗口 ， 以 及 新 窗口 中 文本 的 折 行 效果 。 你 还 看 到 
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了 如 何 使 用 Fouchwin 来 强制 curses 重 新 绘制 窗口 ， 即 使 窗口 内 容 未 发 生 任何 改变 。 
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图 6-5 


接着 , FUTT RO, ARTANA AA, XC T courses Ji nfs] P ifc 
登 窗口 的 。 最 后 ， 程 序 关闭 curses 函 数 | 出 。 

从 上 面 的 示例 代码 中 可 以 看 出 ， 为 了 让 窗口 在 屏幕 上 以 正确 的 顺序 显示 ， 
常 小 心 。 因为 curses 函 数 库 并 不 存储 关于 窗口 之 间 层 次 关系 的 任何 信息 
个 窗口 ， 你 必须 自己 管理 窗口 之 间 的 层次 关系 。 

为 确保 curses 能 够 以 正确 的 顺序 绘制 窗口 ， 你 必须 以 正确 的 顺序 对 它们 进行 刷新 . 其 


中 一 个 办 法 就 是 ， 将 所 有 窗口 的 指针 存储 到 一 个 数组 或 列表 中 ， 你 通过 这 个 数组 或 列表 来 
维护 它们 应 该 显示 在 屏幕 上 的 顺序 . 





你 必须 在 刷新 窗口 时 非 
所 以 如 果 要 求 curses 刷 新 多 




















6.5.4 优化 屏幕 刷新 

从 上 一 节 的 例子 中 可 以 看 出 ， 对 多 个 窗口 进行 刷新 需要 一 定 的 技巧 ， 但 还 不 至 于 太 麻烦 。 但 当 要 
更 新 的 终端 是 通过 慢 速 链 路 连接 到 主机 时 ， 这 个 潜在 的 问题 就 会 变 得 非常 严重 。 现在 这 种 
情况 已 经 很 少见 了 ， 但 实际 上 处 理 这 个 问题 非常 简单 ， 所 以 ， 为 了 内 容 的 完整 性 ， 我 们 在 这 里 介绍 这 
个 问题 的 解决 方法 。 

我 们 的 目标 是 尽量 减少 需要 在 屏幕 上 绘制 的 字符 数目 ， 因 为 在 慢 速 链 路 上 ， 屏 幕 绘制 的 速度 可 能 
会 慢 得 让 人 难以 忍受 。curses 函 数 库 为 此 提供 了 一 种 特殊 手段 ， 这 需要 用 到 下 面 两 个 函数 : 
wnout refresh 和 do 

#include <curses.h> 








date: 





int wnoutrefresh(WINDOW *window ptr); 
int doupdate (void); 
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wnoutrefresh 函 数 用 于 决定 把 哪些 字符 发 送 到 屏幕 上 ， 但 它 并 不 真正 地 发 送 这 些 字符 ， 真 正 将 
更 新 发 送 到 终端 的 工作 由 doupaate 函 数 来 完成 。 如 果 只 是 调用 wnoutrefresh 函 数 ， 然 后 立刻 调用 
doupdate 函 数 ， 则 它 的 效果 与 直接 调用 wrefresh 完 全 一 样 。 但 如 果 想 重新 绘制 多 个 窗口 ， 你 可 以 为 
每 个 窗口 分 别 调用 wnoutrefresh 函 数 〈 当 然 要 按 正 确 的 顺序 来 操作 )， 然 后 只 需 在 调用 最 后 一 个 
wnoutrefresh 之 后 调用 一 次 Goupdate 函 数 即 可 。 这 人 允许 curses 依 次 为 每 个 窗口 执行 屏幕 更 新 计算 工 
作 , 最 后 仅 把 最 终 的 更 新 结果 输出 到 屏幕 上 。 这 种 做 法 可 以 最 大 限度 地 减少 curses 需 要 发 送 的 字符 数目 。 


66 子 窗口 
介绍 完 多 窗口 后 ， 我 们 来 看 一 种 多 窗口 的 特例 : 子 窗口 。 子 窗口 的 创建 和 删除 可 以 用 以 下 儿 个 函 
Moos 


finclude «curses.h» 








WINDOW *subwin(WINDOW *parent, int num of lines, int num of cols, 
int start y, int start x); 
int delwin(WINDOW *window to delete); 


subwin 函 数 的 参数 几乎 与 newwin 函 数 完全 一 样 ， 子 窗口 的 删除 过 程 也 和 其 他 窗口 一 样 ， 都 是 通 
过 调用 delwin 函 数 来 完成 。 如 同 对 待 新 窗口 一 样 ， 你 可 以 使 用 以 mvw 为 前 组 的 函数 来 写 子 窗口 。 事 实 
上 ， 在 大 多 数 情况 下 ， 子 窗口 的 行为 与 新 窗口 非常 相似 ， 两 者 之 间 只 有 一 个 重要 的 区 别 : 子 窗口 没有 
自己 独立 的 屏幕 字符 存储 空间 ， 它 们 与 其 父 窗口 〈 在 创建 子 窗口 时 指定 ) 共享 同一 字符 存储 空间 。 这 
意味 着 ， 对 子 窗口 中 内 容 的 任何 修改 都 会 反映 到 其 父 窗口 中 ， 所 以 删除 子 窗口 时 ， 屏 幕 显示 不 会 发 生 
任何 变化 。 

乍 看 起 来 ， 子 窗口 好 像 没 有 用 处 。 为 何不 直接 在 父 窗口 中 修改 呢 ? 子 窗口 最 主要 的 用 途 是 ， 提 供 
了 一 种 简洁 的 方式 来 卷 动 另 一 窗口 里 的 部 分 内 容 。 在 编写 curses 程 序 时 ， 我 们 经 常会 需要 卷 动 屏幕 的 
某 个 小 区 域 。 通 过 将 这 个 小 区 域 定义 为 一 个 子 窗口 ， 然 后 对 其 进行 卷 动 ， 就 能 达到 我 们 想 要 的 效果 。 

使 用 子 窗口 有 个 强加 的 限制 : 在 应 用 程序 刷新 屏幕 之 前 必须 先 对 其 父 窗口 调用 touchwin 
函数 。 








X 验 Tun 


现在 你 已 看 到 了 这 些 新 函数 ， 下 面 这 个 简短 的 例子 将 显示 它们 是 如 何 工作 的 ， 以 及 它们 与 先前 使 
用 的 窗口 函数 有 何不 同 。 

(1) 首先 是 subsc1 .< 的 初始 化 代码 部 分 ， 它 用 一 些 文本 初始 化 基本 窗口 的 显示 : 

#include <unistd.h> 


#include <stdlib.h> 
#include <curses.h> 


int main() 


t 
WINDOW *sub window ptr; 
int x loop; 
int y loop; 
int counter; 
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char a letter = '1'; 
initscr(); 


for (y loop = 0; y loop < LINES - 1; y loope*) ( 
for (x loop = 0; x loop < COLS - 1; x loope*) ( 
mvwaddch(stdscr, y loop, x loop, a letter); 
a lettere«; 
if (a letter > '9') a letter = '1'; 
$ 
) 


(2) 现在 创建 一 个 新 的 卷 动 子 窗口 .根据 前 面 的 建议 , 必须 在 刷新 屏幕 之 前 对 父 窗口 调用 touchwin 
函数 : 
sub window ptr = subwin(stdscr, 10, 20, 10, 10); 
scrollok(sub window ptr, 1); 


touchwin(stdscr); 
refresh(); 
sleep(1); 


(3) 接 下 来 ， 删 除 子 窗 口中 的 内 容 ， 重 新 输出 一 些 文字 ， 然 后 刷新 它 。 滚 动 文 本 是 通过 1oop 循 环 
来 实现 的 ; 
werase (sub window ptr); 


mvwprintw(sub window ptr, 2, 0, "$s*, "This window will now scroll"); 
wrefresh(sub window ptr); 
sleep(1); 


for (counter = 1; counter < 10; counter++) ( 
wprintw(sub window ptr, "&s*, "This text is both wrapping and V 
scrolling.*); 
wrefresh(sub window ptr); 
sleep(1); 
) 


(4) 循环 结束 后 ， 删 除 子 窗口 ， 然 后 再 次 刷新 基本 屏幕 : 
delwin(sub window ptr); 
touchwin (stdscr) ; 


refresh(); 
sleep(1); 


endwin(); 
exit(EXIT SUCCESS); 
} 


图 6-6 是 程序 执行 结束 后 ， 你 看 到 的 屏幕 显示 情况 。 
实验 解析 
在 安排 指针 sub_window_ptr 指 向 subwin 函 数 调用 的 结果 后 ， 把 子 窗口 设置 为 可 卷 动 。 即 使 在 删 


除了 子 窗口 和 重新 刷新 了 基本 窗口 (stascr) 之 后 ， 屏 幕 上 的 文本 依然 保持 原来 的 样子 ， 这 是 因为 子 
窗口 实际 更 新 的 是 stascr 中 的 字符 数据 。 
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6.7 keypad 模式 


已 看 到 curses 提 供 的 一 些 用 于 处 理 键盘 的 功能 。 一般 键盘 至 少 都 会 包含 方向 键 和 功能 键 , 许多 
有 数字 小 键盘 以 及 诸如 Insert、Home 等 其 他 技 键 。 
对 于 大 多 数 终端 来 说 ,解码 这 些 按键 是 一 件 很 困难 的 事 ， 因 为 它们 往往 会 发 送 以 escape 字 符 开头 的 
字符 串 序列 。 应 用 程序 不 仅 要 区 分 “单独 按 下 Escape 键 ”和 “ 按 下 某 个 功能 键 而 成 的 以 Escape 字 符 开 
头 的 字符 串 序列 ”， 还 必须 处 理 不 同 的 终端 对 于 同一 逻辑 按键 使 用 不 同 字符 串 序列 的 情况 。 

幸运 的 是 ，curses 函 数 库 提供 了 一 个 精巧 的 用 于 管理 功能 键 的 功能 。 对 每 个 终端 来 说 ， 它 的 每 个 
功能 键 所 对 应 的 转 义 序列 都 被 保存 ， 通 常 是 保存 在 一 个 rerminfo 结 构 中 ， 而 头 文件 curses.h 通 过 一 
组 以 KEY 为 前 绥 的 定义 来 管理 逻辑 键 。 

curses 在 启动 时 会 关闭 转 义 序列 与 逻辑 键 之 间 的 转换 功能 ， 该 功能 需要 通过 调用 keypaad 函 数 来 
启用 。 该 函数 调用 成 功 时 ， 返 回 ok， 耕 则 就 返回 ERR。 


#include <curses.h> 






键盘 











int keypad(WINDOW *window ptr, bool keypad on); 

将 keypad_on 参 数 设置 为 Lrue， 然 后 调用 keypaG 函 数 来 启用 keypad 模 式 。 在 该 模式 中 ，curses 
将 接管 按键 转 义 序列 的 处 理工 作 ， 读 键盘 操作 不 仅 能 够 返回 用 户 按 下 的 键 ， 还 将 返回 与 逻辑 按键 对 应 
的 KEY_ 定 义 。 

使 用 keypad 模 式 有 下 面 3 个 小 小 的 限制 。 

O 识别 escape 转 义 序列 的 过 程 是 与 时 间 相 关 的 。 许 多 网 络 协议 会 将 字符 组 合成 数据 包 这 将 导致 
escape 转 义 序列 的 识别 不 准确 ), 或 者 是 将 字符 串 分 割 开 (这 将 导致 功能 键 的 转 义 序列 有 可 能 被 
识别 为 一 个 单独 的 Escape 按 键 和 其 他 独立 的 字符 串 )。 这 种 情况 在 广域网 和 其 他 慢 束 链 路 上 将 
更 为 严重 。 这 一 问题 的 唯一 解决 方法 是 设法 对 终端 进行 编程 ,让 它 针对 用 户 希 望 使 用 的 每 个 功 
能 键 只 发 送 一 个 单独 的 、 唯 一 的 字符 ， 虽 然 这 将 限制 可 使 用 的 控制 字符 的 数目 。 
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O 为 了 让 curses 能 够 区 分 “单独 按 下 Escape 键 ”和 “一 个 以 Escape 字 符 开头 的 键盘 转 义 序列 ”， 
它 必 须 等 待 一 小 段 时 间 。 有 时 候 ， 在 启用 了 keypad 模 式 后 ， 处 理 Escape 按 键 所 造成 的 非常 细微 
的 延 时 都 可 能 会 被 注意 到 。 

口 curses 不 能 处 理 二 义 性 的 escape 转 义 序 列 。 如 果 终 端 上 两 个 不 同 的 按键 会 产生 完全 相同 的 转 义 
序列 ，curses 将 不 会 处 理 这 个 转 义 序列 ， 因 为 它 不 知道 该 返回 哪个 逻辑 按键 。 





使 用 keypad 模 式 


下 面 这 个 小 程序 keypad.c 演 示 了 keypad 模 式 的 使 用 方法 。 当 运行 这 个 程序 时 ， 按 下 Esc 按键 并 注 
意 观察 细微 的 延 时 。 程序 将 在 这 段 延 时 里 判断 这 个 Esc 是 一 个 escape 转 义 序列 的 开头 还 是 一 个 单独 的 按 
di. 

(0) 首先 对 程序 和 curses 函 数 库 进行 初始 化 ， 然 后 启用 keypad 模 式 : 


#include <unistd.h> 
#include <stdlib.h> 
#include «curses.h» 


#define LOCAL ESCAPE KEY 27 


int main() 
{ 
int key; 


initscr(); 
crmode(); 
keypad(stdscr, TRUE); 

(2) 接 下 来 ， 关 闭 回 显 功能 以 防止 光标 在 你 按 下 方向 键 时 发 生 移动 。 然 后 清 屏 并 显示 一 些 文本 。 
程序 将 等 待 用 户 的 击 键 动 作 ， 除 非 用 户 的 按键 是 字母 Q 或 发 生 了 错误 ， 和 否则 按键 所 对 应 的 字符 将 显示 
在 屏 攻 上 。 如 果 按键 匹配 终端 上 的 某 个 转 义 序列 ， 就 把 这 个 转 义 序列 显示 在 屏幕 上 : 

noecho(); 

clear(); 

mvprintw(5, 5, *Key pad demonstration. Press 'q' to quit"); 
move(7, 5); 

refresh(); 

key = getch(); 


while(key !- ERR && key !- 'q') ( 
move(7, 5); 
clrtoeol(); 


if ((key >= 'A' && key <= '2') || 
(key >= 'a' && key <= 'z')) ( 
printw(*Key was $c", (char)key); 
$ 
else { 
switch(key) { 
case LOCAL ESCAPE KEY: printw(*$s', "Escape key"); break; 
case KEY END: printw(*$s", "END key"); break; 
case KEY BEG: printw(*$s*, "BEGINNING key"); break; 
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case KEY RIGHT: printw(*$s*, "RIGHT key"); break; 
case KEY LEFT: printw('$s*, "LEFT key"); break; 
case KEY UP: printw(*$s", "UP key"); break; 
case KEY DOWN: printw("*$s', "DOWN key"); break; 
default: printw(*Unmatched - %d", key); break; 
) /* switch */ 

) /* else */ 


refresh(); 
key = getch(); 
) /* while */ 


endwin(); 
exit(EXIT SUCCESS); 
) 


实验 解析 
在 启用 keypad 模 式 之 后 ， 你 看 到 了 该 模式 是 如 何 识别 键盘 上 的 各 种 其 他 按键 的 ， 这 些 按键 都 将 生 
成 escape 转 义 序列 。 你 还 将 注意 到 Escape 键 的 检测 要 略 慢 于 其 他 按键 。 





68 彩色 显示 


以 前 ， 只 有 极 少数 的 哑 终 端 支持 彩色 显示 功能 ， 所 以 大 多 数 早期 的 curses 函 数 库 都 不 支持 色彩 。 
如 今 , ncurses 和 其 他 大 多 数 现代 的 curses 实 现 版 本 都 提供 了 对 它 的 支持 ,但 遗憾 的 是 ，curses 函 数 
库 的 “ 哑 屏 幕 ”背景 影响 了 其 API，curses 只 能 以 一 种 非常 受 限 的 方式 来 使 用 彩色 ， 这 反映 了 早期 彩 
色 终 端 显示 色彩 能 力 的 缺乏 。 

屏幕 上 的 每 个 字符 位 置 都 可 以 从 多 种 颜色 中 选择 一 种 作为 它 的 前 景色 或 背景 色 。 例 如 ， 你 可 以 在 
红色 背景 上 写 绿色 的 文本 。 

curses 函 数 库 对 颜色 的 支持 有 些 与 众 不 同 ， 即 字符 颜色 的 定义 及 其 背景 色 的 定义 并 不 完全 独立 。 
你 必须 同时 定义 一 个 字符 的 前 景色 和 背景 色 ， 我 们 将 它 称 之 为 颜色 组 合 (color pair. 

在 使 用 curses 函 数 库 的 颜色 功能 之 前 ， 你 必须 检查 当前 终端 是 否 支持 彩色 显示 功能 ， 然 后 对 
curses 的 颜色 例 程 进行 初始 化 。 为 完成 这 个 任务 , 你 需要 使 用 两 个 函数 : has_colors 和 start_color: 

#include «curses.h» 

bool has colors(void); 

int start color(void); 

如 果 终 端 支 持 彩色 显示 ，has_colors 函 数 将 返回 true。 然 后 ， 你 需要 调用 start_color 函 数 ， 
如 果 该 函数 成 功 初始 化 了 颜色 显示 功能 ， 它 将 返回 ok。 一 旦 start_color 函 数 被 成 功 调用 ， 变 晤 
COLOR_PAIRS 将 被 设置 为 终端 所 能 支持 的 颜色 组 合 数目 的 最 大 值 ， 一 般 常见 的 最 大 值 为 4。 变 量 
COLORS 定 义 可 用 颜色 数目 的 最 大 值 ， 一 般 只 有 8 种 。 在 内 部 实现 中 ， 每 种 可 用 的 颜色 以 一 个 从 0 到 63 
的 数字 作为 其 唯一 的 ID 号 。 

在 把 颜色 作为 属性 使 用 之 前 , 你 必须 首先 调用 init_pair 函 数 对 准备 使 用 的 颜色 组 合 进行 初始 化 。 
对 颜色 属性 的 访问 是 通过 coLOR_PAIR 函 数 来 完成 的 : 


#include <curses.h> 
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int init pair(short pair number, short foreground, short background); 
int COLOR PAIR(int pair number); 
int pair content(short pair number, short *foreground, short *background); 


头 文件 curses.h 通 常会 定义 一 些 基 本 颜色 ， 它 们 的 名 字 以 coLOR_ 为 前 组 。 另 外 还 有 个 函数 
pair_concent， 它 的 作用 是 获取 已 定义 的 颜色 组 合 的 信息 。 

下 面 的 语句 将 红色 前 景 绿色 背景 定义 为 一 号 颜色 组 合 : 

init pair(1, COLOR RED, COLOR GREEN); 

然后 ， 通 过 调用 coLOR_PAIR 函 数 ， 将 该 颜色 组 合作 为 属性 来 访问 : 

wattron(window ptr, COLOR PAIR(1)); 

上 面 这 条 语句 的 作用 是 把 屏幕 上 后 续 添加 的 内 容 设置 为 绿色 背景 上 的 红色 内 容 。 

因为 一 个 coLoR_PAIR 就 是 一 个 属性 ， 所 以 可 以 把 它 与 其 他 属性 结合 起 来 。 在 个 人 电脑 上 ， 你 通 
常 通过 “ 按 位 或 ”将 COLOR_PAIR 属 性 和 附加 属性 A_BoLD 相 结合 来 实现 高 浓度 的 颜色 : 

wattron(window ptr, COLOR PAIR(1) | A BOLD); 

下 面 通过 示例 程序 color.c 来 查看 这 些 函数 的 使 用 情况 。 


实 验 彩色 
(1) 首先 检查 这 个 程序 的 显示 终端 是 否 支持 彩色 显示 ， 如 果 支 持 ， 就 启用 彩色 显示 ; 


#include «unistd.h» 
#include <stdlib.h> 
#include <stdio.h> 
#include «curses.h» 





int main() 
t 
int i; 


initscr(); 


if (!has colors()) ( 
endwin(); 
fprintf(stderr, "Error - no color support on this terminal|n"); 
exit(1); 


) 


if (start color() != OK) ( 
endwin(); “ 
fprintf (stderr, *Error - could not initialize colorsin*); 
exit(2); 

) 


(2) 现在 ， 你 可 以 打印 出 终端 可 用 颜色 数目 的 最 大 值 及 支持 的 颜色 组 合 的 最 大 值 。 然 后 ， 程 序 创 
建 7 个 颜色 组 合并 一 次 显示 一 个 : 


clear(); 
mvprintw(5, 5, "There are $d COLORS, and &d COLOR PAIRS available", 
COLORS, COLOR PAIRS); 
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refresh(); 


init pair(1, COLOR RED, COLOR BLACK); 
init pair(2, COLOR RED, COLOR GREEN); 
init pair(3, COLOR GREEN, COLOR RED); 
init pair(4, COLOR YELLOW, COLOR BLUE); 
init pair(5, COLOR BLACK, COLOR WHITE); 
init pair(6, COLOR MAGENTA, COLOR BLUE); 
init.pair(7, COLOR CYAN, COLOR WHITE); 


for (is 1; i <= 7; i++) ( 
attroff (A BOLD); 
attrset(COLOR PAIR(i)); 
mvprintw(5 + i, 5, "Color pair $d*, i); 
attrset(COLOR PAIR(i) | A.BOLD); 
mvprintw(5 + i, 25, "Bold color pair td', i); 
refresh(); 
sleep(1); 
) 


endwin(); 
exit(EXIT SUCCESS); 
) 
这 个 示例 程序 给 出 如 图 6-7 所 示 的 输出 结果 ， 图 中 缺少 了 实际 的 色彩 ， 这 是 当然 的 ， 因 为 这 是 一 张 
黑白 的 屏幕 截图 。 
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图 6-7 


实验 解析 
在 检查 确认 屏幕 支持 彩色 显示 之 后 ， 程 序 初始 化 颜色 处 理 并 定义 了 一 些 颜 色 组 合 。 然 
i 文本 写 到 屏幕 上 ， 以 显示 不 同 颜色 组 合 的 效果 。 


后 ， 程 序 使 
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重新 定义 颜色 


早期 的 哑 终 端 同 一 时 间 只 能 显示 非常 有 限 的 颜色 种 类 ， 但 允许 用 户 对 可 用 的 颜色 集 进行 配置 ， 出 
于 对 这 类 终端 的 支持 考虑 ，curses 函 数 库 可 通过 init_color 函 数 对 颜色 进行 重新 定义 


#include «curses.h» 


int init color(short color number, short red, short green, short blue); 
这 个 函数 可 以 将 一 个 已 有 的 颜色 (范围 从 0 到 coLoRs) 以 新 的 亮度 值 重新 定义 ， 亮 度 值 的 范围 从 0 
到 1 000。 这 有 点 像 为 GIF 格 式 的 图 片 定义 颜色 值 。 


6.9 pad 


在 编写 更 高 级 的 curses 程 序 时 ， 有 时 需要 先 建立 一 个 逻辑 屏幕 ,然后 再 把 它 的 全 部 或 部 分 内 容 输 
出 到 物理 屏幕 上 。 有 时 候 ， 如 果 能 有 一 个 尺寸 大 于 物理 屏幕 的 逻辑 屏幕 ， 一 次 只 显示 该 逻辑 屏幕 的 某 
个 部 分 ， 其 效果 往往 会 更 好 。 

但 使 用 到 目前 为 止 所 学 过 的 curses 函 数 来 实现 这 一 功能 并 不 容易 , 因为 任何 窗口 的 尺寸 都 不 能 大 
于 物理 屏幕 。curses 提 供 了 一 个 特殊 的 数据 结构 pad 来 解决 这 一 问题 ， 它 可 以 控制 尺寸 大 于 正常 窗口 
的 逻辑 屏幕 。 

pad 结构 非常 类 似 wINDoOw 结 构 ， 所 有 执行 写 窗口 操作 的 curses 函 数 同样 可 用 于 pad。pad 还 有 其 自 
己 的 创建 函数 和 刷新 函数 。 

创建 pad 的 方式 与 创建 正常 窗口 的 方式 基本 相同 : 


#include <curses.h> 


WINDOW *newpad(int number of lines, int number of columns); 

需要 注意 的 是 ， 这 个 函数 的 返回 值 是 一 个 指向 wTNDow 结 构 的 指针 ， 这 一 点 与 newwin 函 数 相同 。 
pad 用 Gelwin 函 数 来 删除 ， 这 与 正常 窗口 的 删除 一 样 。 

pad 使 用 不 同 的 函数 执行 刷新 操作 。 因 为 一 个 pad 并 不 局 限于 某 个 特定 的 屏幕 位 置 ， 所 以 必须 指定 
希望 放 到 屏幕 上 的 pad 范 围 及 其 放置 在 屏幕 上 的 位 置 。prefresh 函 数 用 于 完成 这 一 功能 ; 


#include «curses.h» 





int prefresh(WINDOW *pad ptr, int pad row, int pad column, 
int screen row min, int screen col min, 
int screen row max, int screen col max); 


这 个 函数 的 作用 是 将 pad 从 坐标 (pad row, pad column) 开始 的 区 域 写 到 屏幕 上 指定 的 显示 区 
域 ， 该 显示 区 域 的 范围 从 坐标 (screen row min, screen col min) #] (screen row max, 
Screen col max). 

curses 还 提供 了 函数 pnoutrefresh， 它 的 作用 与 函数 wnoutrefresh 一 样 ， 都 是 为 了 更 有 效 地 更 
新 屏幕 。 

我 们 通过 程序 pad.c 来 查看 这 些 函数 的 使 用 方法 。 


实验 使 用 pad 


(D 在 程序 的 开始 首先 初始 化 pad 结 构 ， 然 后 创建 一 个 pad， 创 建 pad 的 函数 将 返回 一 个 指向 该 pad 
的 指针 。 用 字符 填充 这 个 pad 结 构 〈 它 比 终端 显示 区 域 的 长 度 及 宽度 各 多 出 50 个 字符 ); 
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finclude <unistd.h> 
#include <stdlib.h> 
include «curses.h» 


int main() 

{ 
WINDOW *pad ptr; 
int x, y; 
int pad lines; 
int pad cols; 
char disp char; 


initscr(); 

pad lines = LINES + 50; 

pad cols = COLS + 50; 

pad ptr = newpad(pad lines, pad cols); 
disp char tat; 





for (x = 0; x < pad lines; x++) { 
for (y = 0; y < pad. cols; y++) ( 
mvwaddch(pad ptr, x, y, disp char] 
if (disp char == 'z') disp char = 'a'; 
else disp charee; 








(2) 现在 将 pad 的 不 同 区 域 绘制 到 屏幕 的 不 同位 置 上 ， 然 后 结束 程序 : 


prefresh(pad ptr, 5, 7, 2, 2, 9, 9); 
sleep(1); 
prefresh(pad ptr, LINES + 5, COLS + 7, 5, 5, 21, 19); 
sleep(1); 
delwin(pad ptr); 
endwin(); 
exit (EXIT. SUCCESS) ; 
) 


运行 这 个 程序 ， 你 将 看 到 如 图 6-8 所 示 的 输出 结果 。 





Cort 





图 6-8 
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6.10 ”CD 唱片 应 用 程序 


现在 ， 你 已 学 习 完 curses 函 数 库 提供 的 功能 ， 下 面 可 以 开发 一 个 样本 应 用 程序 了 。 下 面 的 C 语 言 
版 本 的 样本 程序 使 用 了 curses 函 数 库 , 这 使 得 屏幕 显示 的 信息 更 加 整齐 规范 , 并 且 它 用 一 个 滚动 窗口 
来 显示 曲目 清单 。 

整个 应 用 程序 长 达 8 页 ， 所 以 我 们 将 其 分 割 为 几 个 部 分 。 完整 的 源 代码 curses_app.c 可 以 从 Wrox 
出 版 社 的 Web 站 点 上 获取 。 这 个 程序 与 本 书 中 的 其 他 程序 一 样 ， 都 遵循 GNU 公 共 许 可 证 。 


CD 数据 库 应 用 程序 的 这 个 版 本 使 用 了 前 面 章节 所 提供 的 信息 ， 它 源 于 第 2 章 里 的 shell 
脚本 程序 我 们 并 未 针对 C 语 言 实现 版 本 对 该 程序 进行 重新 设计 ， 所 以 你 还 可 以 从 这 个 版 
本 中 看 到 很 多 原来 shell 脚 本 的 特征 .要 注意 的 是 ， 这 个 实现 版 本 还 有 一 些 明显 的 不 足 ， 我 
们 将 在 后 面 的 修订 版 本 中 加 以 解决 。 


我 们 将 这 个 应 用 程序 的 代码 分 割 为 几 个 部 分 ， 并 以 下 面 各 小 节 的 标题 加 以 说 明 。 这 里 所 使 用 的 代码 编 
排 规定 与 本 书 的 其 他 部 分 不 太一 样 ， 在 这 里 ， 阴影 部 分 的 代码 只 用 于 显示 对 应 用 程序 里 其 他 函数 的 调用 。 


6.10.1 新 CD 唱片 应 用 程序 的 开始 部 分 


代码 的 第 一 部 分 只 用 于 声明 将 在 后 面 用 到 的 变量 和 函数 ， 并 初始 化 一 些 数据 结构 ， 
(1) 首先 ， 包 含 所 有 必需 的 头 文件 ， 并 定义 一 些 全 局 常量 ; 

finclude <unistd.h> 

*include <stdlib.h> 

#include <stdio.h> 

#include <string.h> 

#include <curses.h> 

















#define MAX_STRING 80 /* Longest allowed response sy 
#define MAX ENTRY 1024 /* Longest allowed database entry */ 
#define MESSAGE LINE 6 /* Misc. messages on this line  */ 
(define ERROR LINE 22 /* Line to use for errors * 
define Q LINE 20 /* Line for questions ua 
define PROMPT LINE 18 /* Line for prompting on k 


(2) 现在 ， 需 要 定义 一 些 全 局 变量 。 变 量 current_ca 用 于 保存 正在 处 理 的 当前 CD 唱片 的 标题 。 该 
变量 的 第 一 个 字符 被 初始 化 为 空 字符 nu11， 表 示 用 户 还 未 选择 CD 唱片 。\0 并 不 是 绝对 必需 的 ， 但 它 
能 确保 该 变量 被 初始 化 了 ， 而 这 通常 是 件 好 事 。 变 量 current_cat 用 于 记录 当前 CD 唱片 的 分 类 号 。 

static char current cd[MAX STRING] = "\0"; 

static char current cat[MAX STRING]; 

(3) 接 下 来 是 一 些 文件 名 的 声明 。 为 简单 起 见 ， 这 个 版 本 中 的 文件 名 都 是 固定 的 ， 临 时 文件 的 文 
件 名 也 是 如 此 。 


但 如 果 有 两 个 用 户 在 同一 目录 下 同时 运行 这 个 程序 ， 就 会 出 现 问题 。 获得 数据 库 文件 
名 的 更 好 方法 是 通过 程序 的 参数 或 是 环境 变量 . 我 们 也 需要 一 种 更 好 的 方法 来 生成 一 个 唯 
一 的 临时 文件 名 ， 这 可 以 通过 POSIX 的 tmpnam 画 数 来 完成 . 我 们 将 在 第 8 章 使 用 MySQL 存 
储 数据 时 解决 这 些 问 题 . 

















610 CD 唱片 应 用 程序 —201 





const char *title file = "title.cdb"; 
const char *tracks file = "tracks.cdb'; 
const char *temp file - "cdb.tmp'; 


(4) 最 后 ， 给 出 所 有 函数 的 原型 定义 : 


void clear all screen(void); 


void get return(void); 
int get confirm(void); 


int getchoice(char *greet, char *choices[]); 

void draw menu(char *options[], int highlight, 
int start row, int start col); 

void insert title(char *cdtitle); 

void get string(char *string); 


void add record(void); 
void count, cds (void) ; 
void find cd(void); 
void list tracks(void); 


void remove tracks(void); 


void remove cd(void):; 
void update cd(void); 


(5) 在 查看 这 些 函数 的 具体 实现 之 前 ,你 需要 定义 一 些 菜单 结构 (实际 上 是 一 个 菜单 选项 的 数组 )。 
当 一 个 菜单 选项 被 选中 时 ， 其 第 一 个 字符 将 被 返回 。 例 如 ， 如 果菜 单 选项 是 Add New CD， 那 么 当 这 


个 选项 被 选中 时 ， 字 符 a 将 被 返 | 
显示 : 
char *main menu[] = 
{ 
"add new CD", 
"find cD", 





5 用户 选中 一 张 CD 唱片 后 ， 扩 展 的 菜单 选项 excendea_menu 将 被 


“count CDs and tracks in the catalog", 


"quit", 
0, 
u 


char *extended menu[] = 
t 

"add new CD*, 

"find CD*, 


"count CDs and tracks in the catalog", 
"list tracks on current CD*, 


"remove current CD", 


"update track information", 


*quit*, 
0, 
} 


上 面 的 内 容 结束 了 程序 的 初始 化 过 程 。 接 下 来 ， 可 以 开始 进入 程序 中 的 函数 了 。 但 首先 ， 需 要 了 


解 这 些 函 数 之 间 的 相互 关系 ， 如 图 6-9 所 示 ， 一 共有 16 个 函数 ， 分 为 如 下 3 类 : 


口 绘制 菜单 


O 将 CD 唱片 资料 添加 到 数据 库 中 


口 获取 和 显示 CD 唱片 数据 
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6.10.2 main 函数 
main 函 数 允 许 用 户 从 菜单 中 进行 选择 ， 直 到 选中 quit〈 退 出 ) 为 止 ， 如 下 所 示 : 
DO 


int choice; 
initscr(); 
do( 





Fri PER NOMINA 





E 
) while (choice !- 'q'); 
endwin(); 
exit(EXIT SUCCESS); 


) 
下 面 我 们 分 别 对 程序 中 的 3 类 函数 进行 分 析 。 
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6.103 ”建立 菜单 


本 节 查 看 与 程序 的 用 户 接口 相关 的 3 个 函数 。 

(1) main 函 数 调用 的 get choice 函 数 是 本 节 的 主要 函数 。getchoice 函 数 的 参数 有 : greet 一 一 介 
绍 信 息 ，choices 一 一 指向 主 菜单 或 扩展 菜单 〈 这 取决 于 用 户 是 否 选择 了 一 张 CD 唱片 ) 。 你 可 以 在 前 
面 的 main 函 数 中 看 到 main_menu 或 extendGed_menu 是 如 何 作为 参数 传递 的 : 


int getchoice(char *greet, char *choices[]) 
t 








static int selected row 
int max row = 0; 

int start screenrow - MESSAGE LINE, start screencol - 10; 
char **option; 

int selecte 
int key = 0; 











option = choices; 

while (*option) ( 
max rowee; 
optione 





) 
/* protect against menu getting shorter when CD deleted */ 
if (selected row >= max row) 
selected row = 0 
clear all screen(); 
mvprintw(start screenrow - 2, start screencol, greet); 
keypad(stdscr, TRUE); 








cbreak() ; 
noecho(); 
key = 0; 
while (key !- 'q' && key !- KEY ENTER && key !- "n') ( 
if (key == KEY UP) ( 
if (selected row == 0) 
selected row = max row - l; 
else 
selected row--; 
) 
if (key == KEY DOWN) ( 
if (selected row -- (max row - 1)) 





selected row = 0; 
else 
selected rowee; 
) 
selected - *choices[selected row]; 
draw menu(choices, selected row, start screenrow, 
start screencol); 
key = getch(); 
) 
keypad (stdscr,' FALSE) ; 
nocbreak(); 
echo() ; 


if (key == 'q') 
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selected - 'q'; 


return (selected); 
) 


(2) getchoice 函 数 内 部 调用 了 两 个 函数 ，clear_all_screen 和 Graw_menu。 我 们 先 来 看 看 
draw_menu 函 数 : 


void draw menu(char *options[], int current, highlight, 
int start row, int start col) 
t 
int current row = 
Char **option ptr; 
Char *txt ptr; 
option ptr = options; 
while (*option ptr) ( 
if (current row == current highlight) attron(A STANDOUT); 
txt ptr = options[current. row]; 
txt, ptree; 
mvprintw(start row + current row, start col, "%s", txt ptr); 
if (current row == current highlight) attroff(A, STANDOUT) ; 
current, rowee; 
option ptree; 





) 


mvprintw(start row + current row + 3, start col, 
"Move highlight then press Return *); 
refresh(); 
) 
(3) 接 下 来 是 clear_all_screen 函 数 ， 让 人 惊讶 的 是 ， 它 只 是 清 屏 并 重 写 软件 标题 。 如 果 用 户 选 
中 了 一 张 CD 唱片 ， 则 在 屏幕 上 显示 它 的 信息 ; 


void clear all screen() 
t 





clear(); 
mvprintw(2, 20, "%s", "CD Database Application"); 
if (current cd[0]) ( 
mvprintw(ERROR LINE, 0, "Current CD: $s: $sin', 
current cat, current cd); 
} 
refresh(); 
} 


6.10.4 ”操作 数据 库 文件 
本 节 介绍 用 于 添加 或 更 新 CD 数据 库 的 函数 。 被 main 函 数 调用 的 函数 有 : ad, record. update cà 


和 remove_cd。 
1. 添加 记录 
(D) 添加 一 张 新 CD 唱 片 的 资料 到 数据 库 : 
void add record() 


t 
Char catalog number[MAX STRING]; 
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char cd title[MAX STRING]; 
Char cd type[MAX STRING]; 

char cd artist[MAX STRING]; 
char cd entry[MAX STRING]; 


int screenrow 
int screencol 


MESSAGE, LINE; 
10; 


clear all screen(); 
mvprintw(screenrow, screencol, "Enter new CD details"); 
Screenrow += 2; 


mvprintw(screenrow, screencol, "Catalog Number: " 
get..string(catalog number); 
screenrowe*; 





mvprintw(screenrow, screencol, * CD Title: *); 
get. string(cd title); 
Screenrowe*; 


mvprintw(screenrow, screencol, * CD Type: 
get. string(cd type); 
screenrowe*; 





mvprintw(screenrow, screencol, * Artist: "); 
get string(cd artist); 
screenrowe*; 


mvprintw(PROMPT LINE-2, 5, "About to add this new entry:" 
sprintf(cd entry, "is, $5, t5, 8s", 
catalog number, cd title, cd type, cd artist); 

mvprintw(PROMPT LINE, 5, *$s*, cd entry); 
refresh(); 
move(PROMPT LINE, 0); 
if (get confirm()) ( 

insert title(cd entry); 

strcpy(current cd, cd title); 

strcpy(current cat, catalog number); 





) 
(2) set_scring 函 数 的 作用 是 从 屏幕 当前 位 置 读 取 一 个 字符 串 ， 并 将 其 末尾 可 能 存在 的 新 行 符 
删除 : 
void get string(char *string) 


( 
int len; 


wgetnstr(stdscr, string, MAX STRING); 
len = strlen(string); 
if (len > 0 && string[len - 1] == '\n') 
string[len - 1] = '\0'; 
) 


(3) gec_confirm 函 数 提示 并 读 取 用 户 的 确认 信息 。 它 读 取 用 户 的 输入 字符 串 ， 检 查 该 字符 串 的 
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第 一 个 字符 是 否 是 Y 或 y， 如 果 是 其 他 字符 ， 则 认为 用 户 未 确认 : 

int get_confirm() 

{ 
int confirmed = 
char first. cha: 
mvprintw(Q LINE, 
clrtoeol(); 
refresh(); 








» "Are you sure? *); 


cbreak(); 

first char = getch(); 

if (first char == 'Y' || first char == 'y') ( 
confirmed - 1; 

) 


nocbreak(); 





if (!confirmed) ( 
mvprintw(Q LINE, 1, * Cancelled"); 
clrtoeol(); 
refresh(); 
sleep(1); 
) 
return confirmed; 


) 


(4) 最 后 ， 我 们 来 看 insert_ticle 函 数 。 它 的 作用 是 将 标题 字符 串 添加 到 标题 文件 的 未 尾 ， 从 而 
在 CD 数据 库 中 添加 一 个 标题 记录 ; 
void insert title(char *cátitle) 
( 
FILE *fp = fopen(title file, *a*); 
if (!fp) { 
mvprintw(ERROR LINE, 0, "cannot open CD titles database"); 
) else ( 
fprintf(fp, "tsWn*, cdtitle); 
fclose(fp); 
) 
) 


2. 更 新 记录 

(1) main 函 数 调用 的 另 一 个 文件 操作 函数 是 upaate_ca。 这 个 函数 使 用 了 一 个 带 边 框 、 可 卷 屏 的 
子 窗 口 ， 它 需要 用 到 一 些 常量 ， 由 于 这 些 常量 在 后 面 的 1ist_tracks 函 数 中 还 会 用 到 ， 所 以 这 些 常量 
被 定义 为 全 局 常量 。 

#define BOXED LINES 11 

*define BOXED ROWS 60 

#define BOX LINE POS 8 

#define BOX ROW POS — 2 

(2) upGate_ca 函 数 允许 用 户 重新 输入 当前 CD 唱片 中 的 曲目 。 在 删除 以 前 的 曲目 记录 后 ， 它 会 提 
示 用 户 输入 新 资料 : 


void update, cd() 
t 
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FILE *tracks_fp; 

Char track name[MAX STRING]; 
int len; 

int track - 1; 

int screen line = 1; 

WINDOW *box window ptr; 
WINDOW *sub window ptr; 


clear all screen(); 
mvprintw(PROMPT LINE, 0, *Re-entering tracks for CD. *]; 
if (!get confirm()) 
return; 
move(PROMPT LINE, 0); 
clrtoeol(); 


remove tracks( 





mvprintw(MESSAGE LINE, 0, "Enter a blank line to finish"); 


tracks fp = fopen(tracks file, *a*]; 





我 们 将 在 下 面 继续 列 出 这 个 函数 的 剩余 代码 。 在 这 里 ， 我 们 稍 作 停顿 ， 解 释 一 下 如 何 
在 带 边框 的 考 屏 窗口 中 输入 数据 ， 这 里 使 用 的 技巧 是 先 创建 一 个 子 窗口 ， 国 绕 它 画 一 个 边 
框 ， 然 后 在 这 个 带 边 框 的 子 窗口 中 再 添加 一 个 新 的 卷 屏 子 窗口 。 








box window ptr = subwin(stdscr, BOXED LINES + 2, BOXED_ROWS + 2, 
BOX LINE POS - 1, BOX ROW POS - 1); 
if (!box window ptr) 
return; 
box(box window ptr, ACS VLINE, ACS HLINE); 


sub window ptr = subwin(stdscr, BOXED LINES, BOXED ROWS, 
BOX LINE POS, BOX ROW.POS); 
if (!sub window ptr) 
return; 
scrollok(sub window ptr, TRUE); 
werase(sub window ptr); 
touchwin(stdscr); 


do ( 
mvwprintw(sub window ptr, screen line««, BOX ROW POS + 2, 
"Track &d: *, track); 
clrtoeol(); 
refresh(); 
wgetnstr(sub window ptr, track name, MAX STRING); 
len - strlen(track name]; 
if (len » 0 && track name[len - 1] 
track name[len - 1] = '\0'; 
if (*track name) 
fprintf(tracks fp, "$s,td,&s Wn", current cat, track, track name); 
trackee; 
if (screen line » BOXED LINES - 1) ( 





n’) 
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/* time to start scrolling */ 
scroll(sub window ptr); 
screen line- ; 
) 
) while (*track name); 
delwin(sub window ptr); 


fclose(tracks fp); 
) 


3. 删除 记录 
(1) main 函 数 调用 的 最 后 一 个 操作 数据 库 的 函数 是 remove_ca: 
void remove cd() 
t 
FILE *titles fp, *temp fp; 
Char entry[MAX ENTRY 
int cat length; 








if (current cd[0] "on 
return; 
Clear all screen(); 


mvprintw(PROMPT LINE, 0, "About to remove CD $s: $s. *, 
current, cat, current. cd); 
if (iget confirm()) 
return; 


cat length = strlen(current cat); 


/* Copy the titles file to a temporary, ignoring this CD */ 
titles fp = fopen(title file, *r*); 
temp fp - fopen(temp file, *w*); 


while (fgets(entry, MAX ENTRY, titles fp)) ( 
/* Compare catalog number and copy entry if no match */ 
if (strncmp(current cat, entry, cat length) != 0) 
fputs(entry, temp fp); 
) 
fclose(titles fp); 
fclose(temp fp); 


/* Delete the titles file, and rename the temporary file */ 
unlink(title file); 
rename(temp file, title file); 





/* Now do the same for the tracks file */ 
remove tracks(); 


/* Reset current CD to 'None' */ 
current cd[0] = 'V0'; 
) 


Q) 现在 ， 只 需要 列 出 remove_tracks 函 数 。 该 函数 的 作用 是 删除 当前 CD 唱片 中 的 曲目 记录 。 它 
同时 被 update_cG 函 数 和 remove_cG 函 数 调用 : 
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void remove tracks() 

t 
FILE *tracks fp, *temp fp; 
Char entry[MAX ENTRY]; 
int cat length; 


if (current cd[0] 
return; 





"on 


cat length = strlen(current cat); 


tracks fp = fopen(tracks file, 'r*); 
if (tracks fp (FILE *)NULL) return; 
temp fp = fopen(temp file, *w*); 








while (fgets(entry, MAX ENTRY, tracks fp)) ( 
/* Compare catalog number and copy entry if no match */ 
if (strnemp(current cat, entry, cat length) 0) 
fputs(entry, temp fp); 








) 
fclose(tracks fp); 
fclose(temp fp); 


/* Delete the tracks file, and rename the temporary file */ 
unlink(tracks, file); 
rename(temp file, tracks file); 





) 
6.10.5 sri) CD 数据 库 


本 节 介 绍 如 何 访问 数据 ， 为 便于 访问 ， 数 据 被 存储 在 一 对 平面 文件 中 ， 并 以 逗号 作为 


符 ， 


(1) 所 有 收集 嗜好 的 本 质 都 是 为 了 了 解 你 收集 的 东西 数量 有 多 少 。 下 面 这 个 函数 就 是 用 来 : 


个 任务 的 。 它 对 数据 库 进行 扫描 并 统计 出 总 的 唱片 数目 和 曲目 数 : 


void count, cds() 
t 
FILE *titles fp, *tracks fp; 
char entry[MAX ENTRY]; 
int titles - 0; 
int tracks = 0; 


titles fp = fopen(title file, "r*); 
if (titles fp) ( 
while (fgets(entry, MAX ENTRY, titles fp)) 
titles++; 
fclose(titles fp); 
) 
tracks fp = fopen(tracks file, *r*); 
if (tracks fp) ( 
while (fgets(entry, MAX ENTRY, tracks fp)) 
trackse*; 
fclose(tracks fp); 
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) 
mvprintw(ERROR LINE, 0, 
"Database contains &d titles, with a total of $d tracks.", 


titles, tracks); 
get return(); 
) 
(2) 如 果 不 小 心 将 最 喜欢 的 CD 唱片 的 标签 弄 丢 了 ， 不 用 担心 ! 由 于 已 经 将 CD 唱片 的 详细 信息 录入 
数据 库 ， 所 以 可 以 通过 调用 fina_ca 函 数 来 查找 曲目 清单 。 它 提示 用 户 输入 一 个 字符 串 ， 根 据 该 字符 
串 在 数据 库 中 进行 匹配 检索 ， 并 把 找到 的 CD 唱片 标题 放 入 全 局 变量 current_ca 中 : 


void find cd() 
( 
Char match[MAX STRING], entry[MAX ENTRY]; 
FILE *titles fp; 
int count - 0; 
char *found, *title, *catalog; 





mvprintw(Q LINE, 0, "Enter a string to search for in CD titles: *); 
get. string(match); 


titles fp = fopen(title file, *r*); 
if (titles fp) ( 
while (fgets(entry, MAX ENTRY, titles fp)) ( 


/* Skip past catalog number */ 
catalog = entry; 
if (found == strstr(catalog, ",")) ( 
*found = '\0'; 
title = found + 1; 


/* Zap the next comma in the entry to reduce it to 
title only */ 

if (found == strstr(title, *,*)) ( 
*found = '\0'; 








/* Now see if the match substring is present */ 
if (found == strstr(title, match)) ( 
countee; 
strcpy(current cd, title); 
strcpy(current cat, catalog); 





H 
) 
fclose(titles fp); 
J 
if (count !- 1) ( 
if (count -- 0) ( 
mvprintw(ERROR LINE, 0, "Sorry, no matching CD found. *); 
) 
if (count » 1) ( 
mvprintw(ERROR LINE, 0, 
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) 


"Sorry, match is ambiguous: $d CDs found. *, count); 
) 
current cd[0] = '\0'; 
get return(); 


虽然 catalog 指 向 的 数组 比 current_cat 要 大 , JE H AR RTÉE ZH EAE IE. 但 在 fgets 函 数 中 的 检查 
就 不 会 发 生 上 述 问题 。 

(3) 还 需要 把 用 户 选中 的 CD 唱片 中 的 曲目 列 在 屏幕 上 。 这 里 会 用 到 在 上 一 小 节 中 为 update_ca 函 
数 中 的 子 窗口 使 用 所 定义 的 全 局 常量 : 


void list tracks() 


t 


FILE *tracks fp; 

char entry([MAX ENTRY]; 
int cat length. 

int lines op = 0; 
WINDOW *track pad ptr; 
int tracks = 0; 

int key; 

int first line = 0; 


if (current cd[0] == '\0') ( 
mvprintw(ERROR LINE, 0, "You must select a CD first. "); 
get return(); 
return; 

) 

clear all screen(); 

cat length = strlen(current. cat) ; 


/* First count the number of tracks for the current CD */ 
tracks fp = fopen(tracks file, "r*); 





if (!tracks fp) 
return; 
while (fgets(entry, MAX ENTRY, tracks fp)) ( 
if (strncmp(current cat, entry, cat length) -- 0) 
tracksee; 


) 


fclose(tracks fp); 


/* Make a new pad, ensure that even if there is only a single 
track the PAD is large enough so the later prefresh() is always 
valid. */ 

track pad ptr = newpad(tracks + 1 + BOXED LINES, BOXED ROWS + 1); 

if (!track pad ptr) 
return; 





tracks fp = fopen(tracks file, *r*); 
if (!tracks fp) 


return; 
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mvprintw(4, 0, "CD Track Listing\n"); 


/* write the track information into the pad */ 
while (fgets(entry, MAX ENTRY, tracks fpl) ( 


/* Compare catalog number and output rest of entry */ 
if (strncmp(current cat, entry, cat length) 0) t 
mvwprintw(track pad ptr, lines ope*, 0, "$s*, 
entry + cat length + 1); 





Y 
) 
fclose(tracks fp); 


if (lines op » BOXED LINES) ( 
mvprintw(MESSAGE LINE, 0, 
"Cursor keys to scroll, RETURN or q to exit"); 
) else ( 
mvprintw(MESSAGE LINE, 0, "RETURN or q to exit"); 
) 
wrefresh(stdscr); 
keypad(stdscr, TRUE); 








cbreak(); 
noecho() ; 
key = 0; 
while (key !- 'q' &k key !- KEY ENTER && key !- '\n') ( 
if (key == KEY UP) ( 
if (first line » 0) 
first line--; 
) 
if (key KEY DOWN) ( 
if (first line + BOXED LINES + 1 < tracks) 





first linee; 


) 


/* now draw the appropriate part of the pad on the screen */ 
prefresh(track pad ptr, first line, 0, 
BOX LINE POS, BOX ROW POS, 
BOX LINE POS + BOXED LINES, BOX ROW POS + BOXED ROWS); 
key = getch(); 
) 


delwin(track pad ptr); 
keypad(stdscr, FALSE); 
nocbreak(); 
echo() ; 
) 
(4) 前 面 两 个 函数 都 调用 了 get_return 函 数 ， 它 的 作用 是 提示 用 户 按 下 回 车 键 并 读 取 它 ， 其 他 字 


符 将 被 忽略 : 


void get return() 
t 
int ch; 
mvprintw(23, 0, *$s", " Press return * 
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refresh(); 
while ((ch = getchar()) !- '\n' && ch !- EOF); 
) 


运行 这 个 程序 ， 你 将 看 到 如 图 6-10 所 示 的 输出 结果 。 


file Edit View Terminal Tabs Help 





CD Database Application 


Options: 


find Cb 

count CDs and tracks in the catalog 

lust tracks on current CD 

renove current CD | 

update track information | 

qut ld 
| 


Move highlight rhen press Return 





Current CO: 623438739: I Giorni | 








图 6-10 


6.41 小 结 


在 本 章 中 ， 我 们 介绍 了 curses 函 数 库 。curses 为 基于 文本 的 程序 提供 了 控制 屏幕 和 读 取 键盘 输 
入 的 好 方 通用 终端 接口 (GTI) 和 直接 cerminfo 数 据 库 访问 相 比 ， 虽 然 curses 并 未 提供 那么 多 
的 控制 功能 ， 但 它 更 易于 使 用 。 如 果 你 正在 编写 一 个 全 屏 的 、 基 于 文本 的 应 用 程序 ， 就 应 该 考虑 使 用 
curses 函 数 库 来 管理 屏幕 和 键盘 。 
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前 面 的 章节 中 ， 我 们 介绍 了 资源 限制 的 问题 。 在 本 章 中 ， 我 们 将 首先 介绍 资源 分 配 的 管理 
Dux. 然后 介绍 如 何 对 可 能 被 多 个 用 户 同时 访问 的 文件 进行 处 理 ， 最 后 介绍 一 个 Linux 系 统 
提供 的 工具 ， 我 们 可 以 利用 它 来 克服 以 普通 文件 作为 数据 存 贮 介 质 时 受到 的 限制 。 
我 们 可 将 这 些 问题 归纳 为 数据 管理 的 3 个 方面 。 
口 动态 内 存 管理 ， 可 以 做 什么 以 及 Linux 不 允许 做 什么 。 
口 文件 锁定 : 协调 锁 、 共 享 文件 的 锁定 区 域 和 避免 死 锁 。 
O abm 数 据 库 :一 个 大 多 数 Linux 系 统 都 提供 的 、 基 本 的 、 不 基于 SQL 的 数据 库 函 数 库 。 


7.1 内 存 管 理 


在 所 有 计算 机 系统 中 ,内 存 都 是 一 种 稀缺 资源 。 无 论 有 多 少 可 用 内 存 ， 它 总 是 显得 不 够 。 在 过 去 ， 
人 们 还 认为 256 MB 的 内 存 已 经 足够 了 。 但 现在 ， 即 使 对 桌面 系统 ，2 GB 的 内 存 也 已 经 是 其 最 低 要 求 
了 ， 服 务 器 系统 通常 需要 的 内 存量 就 更 多 了 。 

从 最 早期 的 操作 系统 版 本 开始 ，UNIX 风 格 的 操作 系统 就 以 一 种 非常 干净 的 方式 来 管理 内 存 ， 因 
为 Linux 系 统 实现 了 X/Open 规 范 ， 所 以 它 也 继承 了 这 一 特点 。 除 了 一 些 特殊 的 嵌入 式 应 用 程序 以 外 ， 
Linux 程 序 决 不 允许 直接 访问 物理 内 存 。 也 许 应 用 程序 看 起 来 好 像 可 以 这 样 做 ， 但 应 用 程序 看 到 的 只 
是 一 个 精心 控制 的 假象 而 已 。 

Linux 为 应 用 程序 提供 了 一 个 简洁 的 视图 ， 它 能 反映 一 个 巨大 的 可 直接 寻 址 的 内 存 空间 。 此 外 ， 
Linux 还 提供 了 内 存 保护 机 制 ， 它 避免 了 不 同 的 应 用 程序 之 间 的 互相 和 干扰。 如果 机 器 被 正确 配置 并 且 
有 足够 的 交换 空间 ，Linux 还 允许 应 用 程序 访问 比 实际 物理 内 存 更 大 的 内 存 空间 。 


7.1.1 简单 的 内 存 分 配 


使 用 标准 C 语 言 函 数 库 中 的 malloc 调 用 来 分 配 内 存 : 

#include «stdlib.h» 

void *malloc(size t size); 

注意 ， 遵 循 X/Open 规 范 的 Linux 与 一 些 UNIX 系 统 不 同 ， 它 不 要 求 包含 malloc.h 头 文件 。 

此 外 ， 用 来 指定 待 分 配 内 存 字 节 数量 的 参数 size 不 是 一 个 简单 的 整 型 ， 虽 然 它 通常 是 一 个 无 

Men, 

你 可 以 在 大 多 数 Linux 系 统 上 分 配 大 量 的 内 存 。 让 我 们 从 一 个 非常 简单 的 例子 开始 ， 但 这 个 例子 
却 足以 打败 旧式 的 基于 MS-DOS 的 程序 , 因为 在 DOS 下 的 程序 不 能 访问 超过 640K 内 存 映射 限制 的 内 存 
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范围 。 


国生 简单 的 内 存 分 配 


输入 下 面 这 个 程序 memory1.c: 


#include <unistd.h> 
#include «stdlib.h» 
#include <stdio.h> 





#define A MEGABYTE (1024 * 1024) 


int main() 

t 
Char *some memory; 
int megabyte = A MEGABYTE; 
int exit code = EXIT FAILURE; 


some memory = (char *)malloc(megabyte); 
if (some memory != NULL) ( 
sprintf(some memory, "Hello World\n"); 
printf(*&s", some memory); 
exit, code = EXIT SUCCESS; 
) 
exit (exit code); 
) 
运行 这 个 程序 时 ， 它 的 输出 如 下 所 示 ; 
$ ./memoryl 
Hello World 


这 个 程序 要 求 malloc 函 数 给 它 返回 一 个 指向 IMB 内 存 空间 的 指针 。 首 先 检查 并 确保 nal loc 函 数 
被 成 功 调用 ， 然 后 通过 使 用 其 中 的 部 分 内 存 来 表明 分 配 的 内 存 确实 已 经 存在 。 当 运行 这 个 程序 时 ， 你 
会 看 到 程序 输出 Hello worla， 这 表明 malloc 确 实 返回 了 1MB 的 可 用 内 存 。 我 们 并 未 对 这 个 1IMB 的 空 
间 进 行 全 面 检查 ， 对 于 mal loc 调 用 的 代码 总 得 有 点 信任 吧 ! 

注意 ， 由 于 malloc 函 数 返回 的 是 一 个 void * 指 针 ， 因 此 需要 通过 类 型 转换 ， 将 其 转换 至 你 需要 
的 char * 类 型 指针 。malloc 函 数 可 以 保证 其 返回 的 内 存 是 地 址 对 齐 的 ， 所 以 它 可 以 被 转换 为 任何 类 
型 的 指针 。 

可 以 这 样 做 的 原因 很 简单 ， 因 为 目前 大 多 数 Linux 系 统 都 使 用 32 位 的 整数 和 32 位 的 指针 来 指向 内 
存 ，32 位 的 指针 可 寻 址 的 地 址 空间 可 达 4GB。 系 统 直 接 用 32 位 的 指针 来 寻 址 ， 而 不 再 需要 段 寄存 器 或 
其 他 技巧 的 能 力 被 称 为 32 位 平面 内 存 模型 。 这 个 模型 还 被 用 于 32 位 版 本 的 Windows XP 和 Vista 系 统 。 
但 你 并 不 能 因此 认为 整数 永远 都 是 32 位 的 ， 因 为 正 有 越 来 越 多 的 64 位 Linux 版 本 投入 实际 使 用 。 
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现在 , 你 已 经 看 到 Linux 能 轻松 打破 MS-DOS 内 存 模型 的 上 限 ， 我 们 不 妨 给 它 出 个 更 难 的 题目 。 下 
面 这 个 程序 将 请 求 系统 分 配 比 机 器 本 身 所 拥有 的 物理 内 存 更 多 的 内 存 。 你 可 能 会 认为 ，malloc 会 在 接 
近 实 际 物理 内 存 容量 的 某 个 地 方 出 现 问题 ， 因 为 内 核 和 其 他 运行 中 的 程序 也 会 占用 部 分 内 存 。 
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xE 请 求全 部 的 物理 内 存 


在 程序 memory2.c 中 ， 我 们 将 请 求 比 机 器 物理 内 存 容 量 更 多 的 内 存 。 你 需要 根据 机 器 的 具体 情况 
来 调整 宏 定义 PHY_MEM_MPGs: 

#include <unistd.h> 

#include <stdlib.h> 

#include <stdio.h> 





#define A_MEGABYTE (1024 * 1024) 
#define PHY MEM MEGS 1024 /* Adjust this number as required */ 


int main() 
t 


char *some memory; 
Size t size to allocate = A MEGABYTE; 
int megs obtained = 0; 


while (megs obtained « (PHY MEM MEGS * 2)) ( 
some memory = (char *)malloc(size to allocate); 
if (some memory !- NULL) ( 
megs obtainede«; 
sprintf(some memory, "Hello World"); 
printf(*&s - now allocated &d Megabytes n", some memory, megs obtained); 
) a 
else { 
exit (EXIT_FAILURE) ; 
) 
) 
exit(EXIT. SUCCESS) ; 
) 


这 个 程序 的 输出 如 下 所 示 ， 我 们 对 输出 结果 做 了 一 些 简化 : 
$ ./memory2 


Hello World - now allocated 1 Megabytes 
Hello World - now allocated 2 Megabytes 


Hello World - now allocated 2047 Megabytes 
Hello World - now allocated 2048 Megabytes 


这 个 程序 与 前 面 的 例子 十 分 类 似 。 它 只 是 通过 循环 来 不 断 申 请 越 来 越 多 的 内 存 ， 直 到 它 已 分 配 了 
在 PHY_MEM_MEGS 中 定义 的 物理 内 存 容量 的 2 倍 为 止 。 看 上 去 这 个 程序 似乎 耗 尽 了 机 器 上 物理 内 存 中 的 
每 个 字 节 ， 但 出 乎 意料 的 是 这 个 程序 竟然 运行 良好 。 注 意 ， 我 们 为 malloc 调 用 的 参数 使 用 了 size_t 
类 型 。 

另 一 个 有 趣 的 现象 是 ， 至 少 在 我 的 这 人 台 机 器 上 ， 整 个 程序 的 运行 时 间 也 就 是 一 姬 眼 的 功夫 。 也 就 
是 说 ， 我 们 不 仅 很 明显 地 耗 尽 了 所 有 的 内 存 ， 而 且 还 非常 快速 。 

我 们 用 程序 memory3 .c 做 进一步 的 研究 ， 看 看 这 人 台 机 器 到 底 有 多 少 内 存 可 以 分 配 。 因 为 现在 我 们 
能 很 清楚 地 发 现 Linux 在 处 理 内 存 请 求 时 表现 得 非常 聪明 ， 所 以 我 们 将 每 次 只 分 配 1K 字 节 的 内 存 并 在 
获得 的 每 个 内 存 块 上 写 入 数据 。 
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zE 可 用 内 存 


下 面 就 是 程序 memory3 .< 的 源 代码 。 就 其 本 质 而 言 ， 这 个 程序 对 于 系统 极 不 友好 ， 而 且 会 严重 影 
响 一 台 多 用 户 机 器 的 运行 。 如 果 对 可 能 的 风险 有 所 顾虑 ， 最 好 不 要 运行 它 ， 因 为 这 不 会 妨碍 你 对 这 部 
分 内 容 的 理解 : 

#include <unistd.h> 


#include <stdlib.h> 
#include <stdio.h> 





fdefine ONE K (1024) 
int main() 


char *some memory; 

int size to allocate - ONE K; 
int megs obtained = 0; 

int ks obtained = 0; 


while (1) ( 
for (ks obtained = 0; ks obtained < 1024; ks obtainede*) ( 
Some memory = (char *)malloc(size to allocate); 
if (some memory == NULL) exit(EXIT FAILURE); 
sprintf(some memory, "Hello World"); 
) 
megs obtainedes; 


printf(*Now allocated $d Megabytes|n*, megs obtained); 
) 


exit(EXIT SUCCESS); 
) 
这 一 次 ， 程 序 的 输出 如 下 《〈 经 简化 ): 


$ ./memory3 
Now allocated 1 Megabytes 


Now allocated 1535 Megabytes 

Now allocated 1536 Megabytes 

Out of Memory: Killed process 2365 

Killed 
然后 程序 就 结束 了 。 运 行 它 所 花费 的 时 间 还 不 少 ， 并 且 当 分 配 的 内 存 大 小 接近 机 器 物理 内 存 容 量 时 ， 
运行 速度 明显 慢 了 下 来 ， 而 且 你 能 很 明显 地 感觉 到 硬盘 的 操作 。 但 这 个 程序 还 是 分 配 了 大 大 超出 机 器 
物理 内 存 容量 的 内 存 。 最 后 ， 系 统 为 了 保护 自己 的 安全 运行 , 终止 了 这 个 仿 歼 的 程序 。 在 一 些 系统 中 ， 
当 malloc 调 用 失败 时 ， 程 序 可 能 只 是 退出 而 不 输出 任何 内 容 。 

应 用 程序 所 分 配 的 内 存 是 由 Linux 内 核 管理 的 。 每 次 程序 请 求 内 存 或 者 尝试 读 写 它 已 经 分 配 的 内 
存 时 ， 便 会 由 Linux 内 核 接管 并 决定 如 何 处 理 这 些 请 求 。 

刚 开始 时 ， 内 核 只 是 通过 使 用 空闲 的 物理 内 存 来 满足 应 用 程序 的 内 存 请 求 ， 但 是 当 物理 内 存 耗 尽 
时 ， 它 便 会 开始 使 用 所 谓 的 交换 空间 (swap space)。 在 Linux 系 统 中 ， 交 换 空间 是 一 个 在 安装 系统 时 
分 配 的 独立 的 磁盘 区 域 。 如 果 熟 悉 Windows 操 作 系统 的 话 ，Linux 交 换 空间 的 作用 有 点 像 隐藏 的 


218 第 7 章 数据 管理 





Windows 交 换文 件 。 但 与 Windows 不 同 ，Linux 的 交换 空间 中 没有 局 部 堆 、 全 局 堆 或 可 丢弃 内 存 段 等 需 
要 在 代码 中 操心 的 内 容 一 一 Linux 内 核 会 为 你 完成 所 有 的 管理 工作 。 

内 核 会 在 物理 内 存 和 交换 空间 之 间 移 动 数 据 和 程序 代码 ， 使 得 每 次 读 写 内 存 时 ， 数 据 看 起 来 总 像 
是 已 存在 于 物理 内 存 中 ， 而 不 管 在 你 访问 它们 之 前 ， 它 们 究竟 是 在 哪里 。 

用 更 专业 的 术语 来 说 ，Linux 实 现 了 一 个 “ 按 需 换 页 的 虚拟 内 存 系统 "。 用 户 程序 看 到 的 所 有 内 存 
全 是 虚拟 的 ， 也 就 是 说 ， 它 并 不 真正 存在 于 程序 使 用 的 物理 地 址 上 。Linux 将 所 有 的 内 存 都 以 页 为 单 
位 进行 划分 ， 通 常 每 一 页 的 大 小 为 4096 字 节 。 每 当 程序 问 内 存 时 ， 就 会 发 生 虚 拟 内 存 到 物理 内 
存 的 转换 ， 转 换 的 具体 实现 和 耗费 的 时 间 取决 于 你 所 使 用 的 特定 硬件 情况 。 当 所 访问 的 内 存在 物理 上 
并 不 存在 时 ， 就 会 产生 一 个 页 面 错误 并 将 控制 权 交 给 内 核 。 

Linux 内 核 会 对 访问 的 内 存 地 址 进行 检查 ， 如 果 这 个 地 址 对 于 程序 来 说 是 合法 可 用 的 ， 内 核 就 会 
确定 需要 向 程序 提供 哪 一 个 物理 内 存 页 面 。 然后 , 如 果 该 页 面 之 前 从 未 被 写 入 过 ,内 核 就 直接 分 配 它 ， 
如 果 它 已 经 被 保存 在 硬盘 的 交换 空间 上 ， 内 核 就 读 取 包含 数据 的 内 存 页 面 到 物理 内 存 〔 可 能 需要 把 一 
个 已 有 页 面 从 内 存 中 移出 到 硬盘 )。 接 着 ， 在 完成 虚拟 内 存 地 址 到 物理 地 址 的 映射 之 后 ， 内 核 允许 用 
运行 。Linux 应 用 程序 并 不 需要 操心 这 一 过 程 ， 因 为 所 有 的 具体 实现 都 已 隐藏 在 内 核 中 了 。 
应 用 程序 耗 尽 所 有 的 物理 内 存 和 交换 空间 ， 或 者 当 最 大 栈 长 度 被 超过 时 ， 内 核 将 拒绝 此 
后 的 内 存 请 求 ， 并 可 能 提前 终止 程序 的 运行 。 


这 种 “终止 进程 ”的 行为 和 早期 的 Linux 版 本 以 及 许多 其 他 版 本 的 UNIX 系 统 有 所 不 同 ， 
后 者 只 是 让 malloc 失 败 。 这 在 术语 上 被 称 为 “内 存 耗 尽 (OOM) 杀 手 ”。 尽管 这 看 上 去 好 像 
非常 严厉 ， 但 实际 上 这 是 为 了 既 能 让 进程 快速 高 效 地 分 配 内 存 ， 又 能 让 Linux 内 核 保护 自 
已 免 爱 资 源 耗 尽 的 破坏 〈 这 是 一 个 严重 的 问题 ) 而 做 的 一 个 很 好 的 妥协。 


那么 ， 这 一 切 对 于 应 用 程序 的 程序 员 来 说 意味 着 什么 呢 ? 简单 地 说 ， 这 都 是 好 消息 。Linux 非 常 
善于 管理 内 存 ， 它 允许 应 用 程序 使 用 数量 非常 巨大 的 内 存 ， 甚 至 使 用 一 个 单独 的 非常 大 的 内 存 块 。 但 
你 必须 记 住 的 是 ， 分 配 两 块 内 存 并 不 会 得 到 一 个 单独 的 可 以 连续 寻 址 的 内 存 块 。 你 得 到 的 是 你 所 要 求 
的 ， 两 个 独立 的 内 存 块 。 

那么 ， 这 种 明显 的 没有 限制 的 内 存 供应 和 在 内 存 耗 尽 前 系统 提前 终止 进程 的 做 法 是 否 意味 着 ， 对 
malloc 函 数 的 返回 值 进行 检查 没有 意义 呢 ? 显然 不 是 。 在 使 用 动态 分 配 内 存 的 C 语 言 程 序 中 ， 一 个 最 
常见 的 问题 是 试图 在 一 个 已 分 配 的 内 存 块 之 后 写 数据 。 在 发 生 这 种 情况 时 , 程序 可 能 并 不 会 立即 终止 ， 
但 你 可 能 已 荐 姜 了 malloc 库 例 程 内 部 使 用 的 一 些 数据 。 

通常 这 可 能 会 导致 后 续 的 malloc 调 用 失败 ， 但 这 并 不 是 因为 没有 足够 的 内 存 可 以 分 配 ， 而 是 因 
为 内 存 的 结构 已 经 被 破坏 。 追 踪 这 类 问题 非常 困难 ， 在 程序 里 越 早 检测 到 这 类 错误 ， 就 越 有 机 会 找到 
其 原因 。 在 本 书 的 第 10 章 介绍 调试 和 优化 的 时 候 ， 我 们 将 讨论 一 些 有 助 于 追踪 这 类 内 存 问题 的 工具 。 




















74.3 滥用 内 存 
假设 想 要 对 内 存 干 点 “坏事 "。 在 下 面 这 个 程序 memory4.c 中 ， 先 分 配 一 些 内存 ， 然 后 尝试 在 它 之 
后 写 些 数据 。 


EY 滥用 内 存 


#include <stdlib.h> 
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$define ONE K (1024) 


int main() 

t 
Char *some memory; 
char *scan ptr; 


some memory - (char *)malloc(ONE K); 
if (some memory -- NULL) exit(EXIT FAILURE); 


Scan ptr - some memory; 
while(1) { 
*scan ptr = '\0'; 
scan ptre*; 
) 
exit(EXIT. SUCCESS); 
) 
程序 的 输出 很 简单 ， 如 下 所 示 : 
$ /memory4 
Segmentation fault 


Linux 内 存 管理 系统 能 保护 系统 的 其 他 部 分 免 受 这 种 内 存 滥 用 的 影响 。 为 了 确保 一 个 行为 恶劣 的 
程序 (如 本 例 ) 无 法 破 化 任何 其 他 程序 ，Linux 会 终止 其 运行 。 

每 个 在 Linux 系 统 中 运行 的 程序 都 只 能 看 到 属于 自己 的 内 存 映 像 ， 不 同 的 程序 看 到 的 内 存 映像 不 同 。 
只 有 操作 系统 知道 物理 内 存 是 如 何 安排 的 ， 它 不 仅 为 用 户 程序 管理 内 存 ， 同 时 也 为 用 户 程序 提供 彼此 之 
间 的 隔离 保护 。 





7.1.4” 空 指针 


与 MS-DOS 不 同 , 现代 的 Linux 系 统 更 像 新 版 本 的 Windows 系 统 , 虽然 实际 的 行为 和 具体 实现 相关 ， 
但 它 对 空 指针 指向 地 址 的 读 写 提供 了 很 强 的 保护 。 


WGEO 访问 空 指针 


我 们 通过 memory5a.c 程 序 来 看 看 访问 空 指针 时 会 发 生 的 情况 : 
#include <unistd.h> 
#include <stdlib.h> 
#include <stdio.h> 


int main() 


( 
char *some memory = (char *)0; 
printf(*A read from null s\n", some memory); 


sprintf(some memory, "A write to null\n"); 
exit(EXIT SUCCESS); 
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其 输出 为 : 


$ ./memorySa 
A read from null (null) 
Segmentation fault 


第 一 个 printf 函 数 试图 打印 一 个 取 自 空 指针 的 字符 串 ， 接 着 sprintf 函 数 尝试 向 一 个 空 指针 里 写 
数据 。 在 本 例 中 ，Linux (EGNU C 函 数 库 的 包装 下 ) 容忍 了 读 操作 ， 它 只 输出 一 个 包含 tnull) VO 
的 “魔术 ”字符 串 。 但 对 于 写 操作 就 没有 如 此 宽容 了 ， 它 直接 终止 了 该 程序 。 这 在 有 些 时 候 能 够 帮助 
我 们 追踪 程序 中 的 漏洞 。 

如 果 再 试 一 次 ， 但 这 次 不 使 用 GNU C 函 数 库 ， 你 将 发 现 从 零 地 址 处 读数 据 也 是 不 允许 的 。 请 看 下 
面 的 memorysb.c 程 序 : 

#include <unistd.h> 


#include <stdlib.h> 
#include <stdio.h> 


int main() 
( 
char z = *(const char *)0; 
printf(*I read from location zero\n"); 
exit(EXIT SUCCESS); 
) 
其 输出 为 : 
$ ./memorySb 
Segmentation fault 
这 次 ， 你 尝试 直接 从 零 地 址 处 读 取 数 据 ， 而 且 这 次 在 你 和 内 核 之 间 并 没有 GNU 的 1ibc 库 存在 ， 于 
是 ， 程 序 被 终止 了 。 要 注意 的 是 ， 有 些 版 本 的 UNIX 系 统 允 许 从 零 地 址 处 读 取 数 据 ， 但 Linux 不 允许 。 





71.5 释放 内 存 


到 目前 为 止 , 我 们 只 是 分 配 内 存 , 然后 希望 当 程序 结束 时 ,我 们 使 用 的 内 存 不 会 丢失 。 幸 运 的 是 ， 
Linux 内 存 管理 系统 完全 有 能 力 保证 在 程序 结束 时 ， 把 分 配给 它 的 内 存 返 回 给 系统 。 但 是 ， 大 多 数 程 
序 需 要 的 并 不 仅仅 是 分 配 一 些 内 存 ， 使 用 一 小 段 时 间 ， 然 后 就 退出 。 一 种 更 常见 的 用 法 是 根据 需要 动 
态 地 使 用 内 存 。 

动态 使 用 内 存 的 程序 应 该 总 是 通过 free 调 用 ， 来 把 不 用 的 内 存 释放 给 malloc 内 存 管理 器 。i 
做 可 以 将 分 散 的 内 存 块 重新 合并 到 一 起 ， 并 由 mal loc 函 数 库 而 不 是 应 用 程序 来 管理 它 。 如 果 一 个 : 
中 的 程序 进程 ) 自己 使 用 并 释放 内 存 ， 则 这 些 自由 内 存 实 际 上 仍然 处 于 被 分 配给 该 进程 的 状态 。 在 
幕后 ，Linux 将 程序 员 使 用 的 内 存 块 作为 一 个 物理 页 面 集 来 管理 ， 通 常 内 存 中 的 每 个 页 面 为 4K 字 节 。 
但 如 果 一 个 内 存 页 面 未 被 使 用 ，Linux 内 存 管理 器 就 可 以 将 其 从 物理 内 存 置换 到 交换 空间 中 (术语 叫 
换 页 )， 从 而 减轻 它 对 资源 使 用 的 影响 。 如 果 程序 试图 访问 位 于 已 置换 到 交换 空间 中 的 内 存 页 中 的 数 
据 ， 那 么 Linux 会 短暂 地 暂停 程序 ， 将 内 存 页 从 交换 空间 再 次 置换 到 物理 内 存 ， 然 后 允许 程序 继续 运 
行 ， 就 像 数据 一 直 存在 于 内 存 中 一 样 。 
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#include <stdlib.h> 


void free(void *ptr_to memory); 


调用 free 时 使 用 的 指针 参数 必须 是 指向 由 mal loc、calloc 或 realloc 调 用 所 分 配 的 内 存 。 你 很 快 
就 将 看 到 calloc 和 realloc 函 数 。 


实验 释放 内 存 


下 面 这 个 程序 被 命名 为 memory6.c: 


#include <stdlib.h> 
#include <stdio.h> 


#define ONE K (1024) 


int main() 
{ 
char *some memory; 
int exit code = EXIT FAILURE; 


Some memory = (char *)malloc(ONE K); 

if (some memory != NULL) ( 
free(some memory); 
printf ("Memory allocated and freed againin'); 
exit code = EXIT SUCCESS; 

) 

exit(exit code); 

) 


输出 结果 是 : 
$ ./memory6 
Memory allocated and freed again 


这 个 程序 显示 了 如 何 调用 free 来 释放 内 存 ，free 函 数 带 有 一 个 指向 先前 分 配 内 存 的 指针 参数 。 


请 记 住 : 一 旦 调用 free 释 放 了 一 块 内 存 ， 它 就 不 再 属于 这 个 进程 。 它 将 由 malloc 函 
数 库 负责 管理 。 在 对 一 块 内 存 调用 free 之 后 ， 就 绝 不 能 再 对 其 进行 读 写 操作 了 。 














7.1.6 ”其 他 内 存 分 配 函 数 


另外 两 个 内 存 分 配 函 数 并 不 像 malloc 和 free 使 用 的 那样 频繁 ， 它 们 是 calloc 和 realloc， 其 
原型 为 : 
#include «stdlib.h» 





void *calloc(size t number of elements, size t element size); 
void *realloc(void *existing memory, s: new size); 


虽然 calloc 分 配 的 内 存 也 可 以 用 free 来 释放 ， 但 它 的 参数 与 nalloc 有 所 不 同 。 它 的 作用 是 为 一 
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个 结构 数组 分 配 内 存 ， 因 此 需要 把 元 素 个 数 和 每 个 元 素 的 大 小 作为 其 参数 。 它 所 分 配 的 内 存 将 全 部 初 
始 化 为 0。 如 果 calloc 调 用 成 功 ， 将 返回 指向 数组 中 第 一 个 元 素 的 指针 。 与 malloc 调 用 类 似 ， 后 续 的 
calloc 调 用 无 法 保证 能 返回 一 个 连续 的 内 存 空间 , 因此 不 能 通过 重复 调用 calloc, 并 期 望 第 二 个 调用 
返回 的 内 存 正好 接 在 第 一 个 调用 返回 的 内 存 之 后 来 扩大 calloc 调 用 创建 的 数组 。 

realloc 函 数 用 来 改变 先前 已 经 分 配 的 内 存 块 的 长 度 。 它 需要 传递 一 个 指向 先前 通过 malloc、 
calloc 或 realloc 调 用 分 配 的 内 存 的 指针 , 然后 根据 new_size 参 数 的 值 来 增加 或 减少 其 长 度 。 为 了 完 
成 这 一 任务 ，realloc 函 数 可 能 不 得 不 移动 数据 ， 因 此 特别 重要 的 一 点 是 ， 你 要 确保 一 旦 内 存 被 重新 
分 配 之 后 ， 你 必须 使 用 新 的 指针 而 不 是 使 用 realloc 调 用 前 的 那个 指针 去 访问 内 存 。 

另外 一 个 需要 注意 的 问题 是 ， 如 果 realloc 无 法 调整 内 存 块 大 小 的 话 ， 它 会 返回 一 个 nul1 指 针 。 
这 就 意味 着 在 一 些 应 用 程序 中 ， 你 必须 避免 使 用 类 似 下 面 这 样 的 代码 : 


my ptr = malloc (BLOCK_SIZE) ; 


my ptr = realloc(my ptr, BLOCK SIZE * 10); 

如 果 realloc 调 用 失败 ， 它 将 返回 一 个 空 指针 ，my_ptzr 就 将 指向 nul1， 而 先前 用 mal loc 分 配 的 内 
存 将 无 法 再 通过 my_ptr 进 行 访问 。 因 此 ， 在 释放 老 内 存 块 之 前 ， 最 好 的 方法 是 先 用 malloc 请 求 一 块 
新 内 存 ， 再 通过 memcpy 调 用 把 数据 从 老 内 存 块 复制 到 新 的 内 存 块 。 这样 即 使 出 现 错误 ， 应 用 程序 还 是 
可 以 继续 访问 存储 在 原来 内 存 块 中 的 数据 ， 从 而 能 够 实现 一 个 干净 的 程序 终止 。 


7.2 文件 锁定 


文件 锁定 是 多 用 户 、 多 任务 操作 系统 中 一 个 非常 重要 的 组 成 部 分 。 程 序 经 常 需要 共享 数据 ， 而 这 
通常 是 通过 文件 来 实现 的 。 因此， 对 于 这 些 程序 来 说 ， 建 立 某 种 控制 文件 的 方式 就 非常 重要 了 。 只 有 
这 样 ， 文 件 才 可 以 通过 一 种 安全 的 方式 更 新 ， 或 者 说 ， 当 一 个 程序 正在 对 文件 进行 写 操作 时 ， 文 件 就 
会 进入 一 个 暂时 状态 ， 在 这 个 状态 下 ， 如 果 另外 一 个 程序 尝试 读 这 个 文件 ， 它 就 会 自动 停 下 来 等 待 这 
个 状态 的 结束 。 

Linux 提 供 了 多 种 特性 来 实现 文件 锁定 。 其 中 最 简单 的 方法 就 是 以 原子 操作 的 方式 创建 锁 文 件 ， 
所 谓 “ 原 子 操作 ”就 是 在 创建 锁 文 件 时 ， 系 统 将 不 允许 任何 其 他 的 事情 发 生 。 这 就 给 程序 提供 了 一 
种 方式 来 确保 它 所 创建 的 文件 是 唯一 的 ， 而 且 这 个 文件 不 可 能 被 其 他 程序 在 同一 时 刻 创建 。 

第 二 种 方法 更 高 级 一 些 ， 它 允许 程序 锁定 文件 的 一 部 分 ， 从 而 可 以 独 享 对 这 一 部 分 内 容 的 访问 。 
有 两 种 不 同 的 方式 可 以 实现 第 二 种 形式 的 文件 锁定 。 我 们 将 只 对 其 中 的 一 种 做 详细 介绍 ， 因 为 两 种 方 
式 非常 相似 一 一 第 二 种 方式 只 不 过 是 程序 接口 稍微 不 同 而 已 。 


7.2.1 创建 锁 文件 


许多 应 用 程序 只 需要 能 够 针对 某 个 资源 创建 一 个 锁 文 件 即 可 。 然 后 ， 其 他 程序 就 可 以 通过 检查 这 
个 文件 来 判断 它们 自己 是 否 被 允许 访问 这 个 资源 。 

这 些 锁 文件 通常 都 被 放置 在 一 个 特定 位 置 ， 并 带 有 一 个 与 被 控制 资源 相关 的 文件 名 。 例 如 ， 当 一 
个 调制 解 调 器 正在 被 使 用 时 ，Linux 通 常会 在 /var/spool 目 录 下 创建 一 个 锁 文件 。 

注意 ， 锁 文件 仅仅 只 是 充当 一 个 指示 器 的 角色 ， 程 序 间 需 要 通过 相互 协作 来 使 用 它们 。 用 术语 来 
说 ， 锁 文件 只 是 建议 锁 ， 而 不 是 强制 锁 ， 在 后 者 中 ， 系 统 将 强制 锁 的 行为 。 

为 了 创建 一 个 用 作 锁 指示 器 的 文件 ， 你 可 以 使 用 在 fcnt1.h 头 文件 (你 在 前 面 的 章节 中 见 过 这 个 
文件 ) 中 定义 的 open 系 统 调 用 ， 并 带 上 o_cREAT 和 o_ExcL 标 志 。 这 样 能 够 以 一 个 原子 操作 同时 完成 两 
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项 工作 : 确定 文件 不 存在 ， 然 后 创建 它 。 


实验 创建 锁 文件 


你 可 以 在 下 面 的 程序 lockl .c 中 看 到 锁 文件 是 如 何 创 建 的 : 


#include «unistd.h» 
#include «stdlib.h» 
#include <stdio.h> 
#include «fcntl.h» 
#include «errno.h» 


int main() 

{ 
int file desc; 
int save errno; 


file desc = open(*/tmp/LCK.test*, O_RDWR | O CREAT | O EXCL, 0444); 
if (file desc == -1) ( 
save errno = errno; 
printf(*Open failed with error %d\n", save errno); 
) 
else ( 
printf ("Open succeededWn*); 


} 
exit(EXIT SUCCESS); 


第 一 次 运行 这 个 程序 时 ， 它 的 输出 是 : 
$ ./1ockl 
Open succeeded 


但 当 你 再 次 运行 这 个 程序 时 ， 它 的 输出 是 : 


$ ./lockl 
Open failed with error 17 


这 个 程序 调用 带 有 oO_CREAT 和 0_ExcL 标 志 的 open 来 创建 文件 /tmp/LCK.test。 第 一 次 运行 程序 
时 ， 由 于 文件 并 不 存在 ， 所 以 open 调 用 成 功 。 但 对 程序 的 后 续 调 用 失败 了 ， 因 为 文件 已 经 存在 了 。 如 
果 想 让 程序 再 次 执行 成 功 ， 你 必须 删除 那个 锁 文 件 。 

至 少 在 Linux 系 统 中 ， 错 误 号 17 代 表 的 是 EExIsT， 这 个 错误 用 来 表示 一 个 文件 已 存在 。 错 误 号 定 
义 在 头 文件 errno.h 或 (更 常见 的 ) 它 所 包含 的 头 文件 中 。 在 本 例 中 ， 这 个 错误 号 实际 定义 在 头 文件 
/usr/include/asm-generic/errno-base.h 中 : 

#define EEXIST 17 /* File exists */ 

这 是 一 个 适合 于 表示 open (0_CREAT | 0_EXCL) 失败 的 错误 号 。 

如 果 一 个 程序 在 它 执行 时 ， 只 需 独 占 某 个 资源 一 段 很 短 的 时 间 一 一 这 用 术语 来 说 ， 通 常 被 称 为 临 
界 区 ， 它 就 需要 在 进入 临界 区 之 前 使 用 open 系 统 调用 创建 锁 文件 ， 然 后 在 退出 临界 区 时 用 unlink 系 
统 调用 删除 该 锁 文 件 。 

你 可 以 通过 编写 一 个 示例 程序 并 同时 运行 它 的 两 份 副本 ， 来 演示 程序 是 如 何 利用 这 个 锁 机 制 来 协 
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调 工作 的 。 你 将 用 到 在 第 4 章 中 见 过 的 getpia 调 用 ， 它 返回 进程 标识 符 ， 一 个 对 于 每 个 当前 运行 的 程 
序 都 唯一 的 数字 编号 。 


实验 协调 性 锁 文件 


(1) 下 面 是 测试 程序 lock2.c 的 源 代码 : 


finclude <unistd.h> 
#include <stdlib.h> 
#include <stdio.h> 
#include «fcntl.h» 
#include <errno.h> 





const char *lock file = "/tmp/LCK.test2"; 
int main() 
{ 


int file desc; 
int tries - 10; 


while (tries--) ( 
file: = EER EN O_RDWR | O_CREAT | O_EXCL, 0444); 
if (file_desc == -1) 
printf(*&d - Lock TA presentWn*, getpid()); 
sleep(3); 
) 
else ( 


(2) 临界 区 从 这 里 开始 : 
Printf("%d - I have exclusive access|n*, getpid()); 
sleep1); 
(void)close(file desc); 
(void)unlink(lock file); 
(3) 在 这 里 结束 : 


sleep(2); 





H 
exit(EXIT SUCCESS); 
} 


在 运行 这 个 程序 之 前 ， 你 应 该 先 用 下 面 的 命令 来 确保 锁 文 件 不 存在 : 
$ rm -f /tmp/LCK.test2 

然后 用 下 面 这 个 命令 来 运行 这 个 程序 的 两 份 副本 : 

$ ./lock2 & ./lock2 


这 个 命令 在 后 台 运 行 1ock2 的 一 份 副本 ， 在 前 台 运 行 另 一 份 副本 。 下 面 是 它 的 输出 结果 ; 


1284 - I have exclusive access 
1283 - Lock already present 


72 文件 锁定 225 





1283 - I have exclusive access 
1284 - Lock already present 
1284 - I have exclusive access 
1283 - Lock already present 
1283 - I have exclusive access 
1284 - Lock already present 
1284 - I have exclusive access 
1283 - Lock already present 
1283 - I have exclusive access 
1284 - Lock already present 
1284 - I have exclusive access 
1283 - Lock already present 
1283 - I have exclusive access 

- Lock already present 

- I have exclusive access 

- Lock already present 


1284 
1284 
1283 
1283 - I have exclusive access 
1284 - Lock already present 


上 面 的 例子 显示 了 同一 个 程序 的 两 个 实例 是 如 何 协调 工作 的 。 当 运行 这 个 例子 的 时 候 ， 你 几乎 肯 
定 会 看 到 与 上 述 输出 不 同 的 进程 标识 符 ， 但 程序 的 行为 将 是 一 样 的 

出 于 演示 目的 ， 你 使 用 while 语 名 让 程序 循环 10 次 。 这 个 程序 然后 通过 创建 一 个 唯一 的 锁 文 件 
/tmp/LCK.test2 来 访问 临界 资源 。 如 果 因 为 文件 已 存在 而 失败 ， 程 序 将 等 候 一 小 段 时 间 后 再 次 尝试 。 
如 果 成 功 ， 它 就 可 以 开始 访问 资源 。 在 标记 为 “临界 区 ”的 部 分 ， 你 可 以 执行 任何 需要 独占 式 访问 的 
处 理 。 

因为 这 只 是 一 个 演示 程序 ， 所 以 你 只 等 待 了 一 小 段 时 间 。 程 序 使 用 完 资源 后 ， 它 将 通过 删除 锁 文 
件 来 释放 锁 。 然 后 它 可 以 在 重新 申请 锁 之 前 执行 一 些 其 他 的 处 理 〈 本 例 中 只 是 调用 sleep 函 数 )。 这 里 
锁 文 件 扮演 了 类 似 二 进 制 信号 量 的 角色 ， 就 问题 “我 可 以 使 用 这 个 资源 吗 ? ”给 每 个 程序 一 个 “是 ” 
或 “ 否 ”的 答案 。 你 将 在 第 14 章 进一步 学 习 信 号 量 。 


这 是 一 个 进程 间 协调 性 的 安排 ， 你 必须 正确 地 编写 代码 以 使 其 正常 工作 ， 意 识 到 这 一 
点 是 非常 重要 的 。 当 程序 创建 锁 文 件 失败 时 ， 它 不 能 通过 删除 文件 并 重新 尝试 的 方法 来 解 
决 此 问题 。 或 许 这 样 做 可 以 让 它 创建 锁 文 件 ， 但 另 一 个 创建 锁 文件 的 程序 将 无 法 得 知 它 已 
经 不 再 拥有 对 这 个 资源 的 独占 式 访问 权 了 。 

















7.2.2 ”区 域 锁定 


用 创建 锁 文件 的 方法 来 控制 对 诸如 串 行 口 或 不 经 常 访问 的 文件 之 类 的 资源 的 独占 式 访问 ， 是 一 个 
不 错 的 选择 ， 但 它 并 不 适用 于 访问 大 型 的 共享 文件 。 假 设 你 有 一 个 大 文件 ， 它 由 一 个 程序 写 入 数据 ， 
但 却 由 许多 不 同 的 程序 同时 对 这 个 文件 进行 更 新 。 当 一 个 程序 负责 记录 长 期 以 来 连续 收集 到 的 数据 ， 
而 其 他 一 些 程序 负责 对 记录 的 数据 进行 处 理 时 ， 这 种 情况 就 可 能 发 生 。 处 理 程序 不 能 等 待 记录 程序 结 
束 ， 因 为 记录 程序 将 一 直 不 停 地 运行 ， 所 以 它们 需要 一 些 协调 方法 来 提供 对 同一 个 文件 的 并 发 访问 。 

你 可 以 通过 锁定 文件 区 域 的 方法 来 解决 这 个 问题 ， 文 件 中 的 某 个 特定 部 分 被 锁定 了 ， 但 其 他 程序 
可 以 访问 这 个 文件 中 的 其 他 部 分 。 这 被 称 为 文件 段 锁定 或 文件 区 域 锁定 。Linux 提 供 了 至 少 两 种 方式 
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来 实现 这 一 功能 : 使 用 fcnt1 系 统 调用 和 使 用 lockf 调 用 。 我 们 将 主要 介绍 fcnt1 接 口 ， 因 为 它 是 最 常 
使 用 的 接口 .lockf 和 fcnt1 非 常 相似 , 在 Linux 中 , 它 一 般 作 为 fcnt1 的 备 选 接口 。 但 是 , fcnt1 和 1lockf 
的 锁定 机 制 不 能 同时 工作 : 它们 使 用 不 同 的 底层 实现 ， 因 此 决 不 要 混合 使 用 这 两 种 类 型 的 调用 ， 而 应 
坚持 使 用 其 中 的 一 种 。 

你 已 在 第 3 章 中 见 过 fcnt1 调 用 ， 它 的 定义 如 下 所 示 : 


#include «fcntl.h» 


int fcntl(int fildes, int command, ...); 
fcnt1 对 一 个 打开 的 文件 描述 符 进行 操作 ， 并 能 根据 commana 参 数 的 设置 完成 不 同 的 任务 。 它 为 
我 们 提供 了 3 个 用 于 文件 锁定 的 命令 选项 : 
O F GETLK 
O F_SETLK 
O F_SETLKW 
当 使 用 这 些 命令 选项 时 ，fcnt1 的 第 三 个 参数 必须 是 一 个 指向 f1ock 结 构 的 指针 ， 所 以 实际 的 函 
数 原型 应 为 ; 
int fcntl(int fildes, int command, struct flock *flock structure); 
flock (文件 锁 ) 结构 依赖 具体 的 实现 ， 但 它 至 少 包含 下 述 成 员 ; 
Q short 1 type 
U short 1 whence 
口 off t 1 start 
Q off t 1 len 
O pid t 1 pià 
1l_type 成 员 的 取 值 定义 在 头 文件 fcnt1.h 中 ， 如 表 7-1 所 示 。 
X 7-1 
取 值 w m 
F-RDLCK 共享 (或 读 ) 锁 。 许 多 不 同 的 进程 可 以 拥有 文件 同一 或 者 重 登 ) 区 域 上 的 共享 锁 。 只 要 任 
进程 拥有 一 把 共享 锁 ， 那 么 就 没有 进程 可 以 再 获得 该 区 域 上 的 独占 锁 。 为 了 获得 一 把 共享 锁 ， 文 
件 必 须 以 “ 读 ” 或 “ 读 / 写 ”方式 打开 
F-UNLCK 解锁 ， 用 来 清除 锁 
PENRE: 独占 (或 写 ) 锁 。 只 有 一 个 进程 可 以 在 文件 的 任 一 特定 区 域 拥有 一 把 独占 锁 。 一 旦 一 个 进程 拥 
有 了 这 样 一 把 锁 ， 任 何其 他 进程 都 无 法 在 该 区 域 上 获得 任何 类 型 的 锁 。 为 了 获得 一 把 独占 锁 ， 文 
件 必须 以 “ 写 ” 或 “ 读 / 写 ”方式 打开 
1_whence、1_start 和 1_len 成 员 定义 了 文件 中 的 一 个 区 域 ， 即 一 个 连续 的 字 节 集合 。1_whence 
的 取 值 必须 是 SEEK_SET、 SEEK CUR. SEEK END (在 头 文件 unistd.h 中 定义 ) 中 的 一 个 。 它 们 分 别 
对 应 于 文件 头 、 当 前 位 置 和 文件 尾 。1_whence 定 义 了 1_start 的 相对 偏 移 值 ， 其 中 ，1_start 是 该 区 
域 的 第 一 个 字 节 。1_whence 通 常 被 设 为 SEEK_SET， 这 时 1_start 就 从 文件 的 开始 计算 。1_len 参 数 定 
义 了 该 区 域 的 字 节 数 。 
1_pid 参 数 用 来 记录 持 有 锁 的 进程 ， 参 见 下 面 对 F_GETLK 的 介绍 。 
文件 中 的 每 个 字 节 在 任 一 时 刻 只 能 拥有 一 种 类 型 的 锁 : 共享 锁 、 独 占 锁 或 解锁 。fcnt1 调 用 可 用 
的 命令 和 选项 的 组 合 相当 多 ， 我 们 将 在 下 面 依次 介绍 它们 。 
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1. FP_GETLK 命 令 

第 一 个 命令 是 F_GETLK。 它 用 于 获取 fildes (第 一 个 参数 ) 打开 的 文件 的 锁 信息 。 它 不 会 尝试 去 
锁定 文件 。 调 用 进程 把 自己 想 创 建 的 锁 类 型 信息 传递 给 fcncl， 使 用 F_GETLK 命 令 的 fcnt1 就 会 返回 将 
会 阻止 获取 锁 的 任何 信息 。 

flock 结 构 中 使 用 的 值 如 表 7-2 所 示 。 





表 7-2 
m 值 说 m 
l_type 如 果 是 共享 〈 只 读 ) 锁 则 取 值 为 F_RprcK， 如 果 是 独占 《 写 )》 锁 则 取 值 为 F_wRLCK 
l whence SEEK SET. SEEK CUR. SEEK END'PÍÉJ—^4- 
l.start 感 兴趣 的 文件 区 域 的 第 一 个 字 节 的 相对 位 置 
1_len 感 兴趣 的 文件 区 域 的 字 节 数 


lpid 持 有 锁 的 进程 的 标识 符 


进程 可 能 使 用 F_GETLK 调 用 来 查看 文件 中 某 个 区 域 的 当前 锁 状 态 。 它 应 该 设置 flock 结 构 来 表明 
它 需 要 的 锁 类 型 ， 并 定义 它 感 兴趣 的 文件 区 域 。fcnc1 调 用 如 果 成 功 就 返回 非 -1 的 值 。 如 果 文 件 已 被 
锁定 从 而 阻止 锁 请 求 成 功 执行 , fcnc1 会 用 相关 信息 覆盖 flock 结 构 。 如 果 锁 请 求 可 以 成 功 执行 , flock 
结构 将 保持 不 变 。 如 果 F_GETL& 调 用 无 法 获得 信息 ， 它 将 返回 -1 表明 失败 。 

如 果 P_GETLK 调 用 成 功 〈 例 如 ， 它 返回 一 个 非 -1 的 值 )， 调 用 程序 就 必须 检查 flocx 结 构 的 内 容 来 
判断 其 是 否 被 修改 过 。 因 为 1_pia 的 值 被 设置 成 持 有 锁 的 进程 (如 果 有 的 话 ) 的 标识 符 ， 所 以 通过 检 
查 这 个 字段 就 可 以 很 方便 地 判断 出 flock 结 构 是 否 被 修改 过 。 

2.F_SETLK 命 令 

这 个 命令 试图 对 filaes 指 向 的 文件 的 某 个 区 域 加 锁 或 解锁 。f1ock 结 构 中 使 用 的 值 〈 与 F_GETLK 
命令 中 用 到 的 不 同 之 处 ) 如 表 7-3 所 示 。 








表 7-3 
m 值 m m" 
l.type 如 果 是 只 读 或 共享 镇 则 取 值 为 F_RDLCK， 如 果 是 独占 或 写 锁 则 取 值 为 P_wRLCK, 
如 果 是 解 镇 则 取 值 为 F_UNLCK 


lpia 不 使 用 


与 E_GETLK 一 样 ， 要 加 锁 的 区 域 由 flock 结 构 中 的 1_start、1_whence 和 1_len 的 值 定义 。 如 果 加 
锁 成 功 ，fcnt1 将 返回 一 个 非 -1 的 值 ， 如 果 失 败 ， 则 返回 -1。 这 个 函数 总 是 立刻 返回 。 

3. F_SETLKW 命 令 

F_SETLKW 命 令 与 上 面 介绍 的 5_sETLK 命 令 作用 相同 ， 但 在 无 法 获取 锁 时 ， 这 个 调用 将 等 待 直到 可 
以 为 止 。 一 旦 这 个 调用 开始 等 待 ， 只 有 在 可 以 获取 锁 或 收 到 一 个 信号 时 它 才 会 返回 。 我 们 将 在 第 11 章 
讨论 信号 。 

程序 对 某 个 文件 拥有 的 所 有 锁 都 将 在 相应 的 文件 描述 符 被 关闭 时 自动 清除 。 在 程序 结束 时 也 会 自 
动 清除 各 种 锁 。 


7.2.3 ”锁定 状态 下 的 读 写 操作 


当 对 文件 区 域 加 锁 之 后 ， 你 必须 使 用 底层 的 reaG 和 write 调 用 来 访问 文件 中 的 数据 ， 而 不 要 使 用 
更 高 级 的 fread 和 fwrite 调 用 ， 这 是 因为 freaG 和 fwrite 会 对 读 写 的 数据 进行 缓存 ， 所 以 执行 一 次 
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fread 调 用 来 读 取 文件 中 的 头 100 个 字 节 可 能 (事实 上 ， 是 几乎 肯定 如 此 ) 会 读 取 超 过 100 个 字 节 的 数 
据 ， 并 将 多 余 的 数据 在 函数 库 中 进行 缓存 。 如 果 程 序 再 次 使 用 freaa 来 读 取 下 100 个 字 节 的 数据 ， 它 实 
际 上 将 读 取 已 缓冲 在 函数 库 中 的 数据 ， 而 不 会 引发 一 个 底层 的 reaa 调 用 来 从 文件 中 取出 更 多 的 数据 。 

为 了 说 明 这 为 什么 是 一 个 问题 ， 让 我 们 来 考虑 这 样 一 个 例子 : 两 个 程序 都 打算 更 新 同一 个 文件 。 
假设 这 个 文件 由 200 个 全 为 零 的 字 节 组 成 。 第 一 个 程序 先 开始 运行 , 并 获得 该 文件 头 100 个 字 节 的 写 锁 。 
它 然后 使 用 freaa 来 读 取 这 100 个 字 节 。 但 是 正如 我 们 在 前 面 章节 中 所 看 到 的 ，fread 会 一 次 读 取 多 达 
BUFSI2 个 字 节 的 数据 ， 因 此 ， 它 实际 上 把 整个 文件 都 读 到 了 内 存 中 ,但 仅 把 头 100 个 字 节 传递 给 程序 。 

接着 ， 第 二 个 程序 开始 运行 。 它 获得 了 文件 后 100 个 字 节 的 写 锁 。 这 个 操作 将 会 成 功 ， 因 为 第 一 
个 程序 只 锁定 了 文件 的 前 100 个 字 节 。 第 二 个 程序 将 100~199 字 节 的 数据 都 写成 2， 关 闭 文件 并 解锁 ， 
最 后 退出 程序 。 这 时 ， 第 一 个 程序 锁定 了 文件 的 后 100 个 字 节 ， 然 后 调用 freaa 来 读 取 数据 。 尽 管 真正 
存在 于 文件 中 的 数据 是 100 个 字 节 的 2， 但 是 因为 先前 数据 已 经 被 缓存 ， 所 以 程序 实际 上 读 到 的 数据 将 
是 100 个 字 节 的 零 。 但 如 果 你 使 用 reaa 和 wrice， 这 个 问题 就 不 会 发 生 。 

上 述 关于 文件 锁 的 描述 看 起 来 似乎 很 复杂 ， 但 实际 上 是 说 起 来 难 ， 做 起 来 反而 要 容易 一 些 。 


EELEE 


下 面 ， 我 们 通过 示例 程序 lock3 .c 来 看 文件 锁定 是 如 何 工 作 的 。 为 了 试验 锁定 ， 你 需要 两 个 程序 ; 
-个 用 来 锁定 而 另外 一 个 进行 测试 。 第 一 个 程序 完成 锁定 。 

(1) 程序 从 包含 头 文件 和 变量 声明 开始 : 

#include <unistd.h> 

#include <stdlib.h> 


#include <stdio.h> 
#include «fcntl.h» 





const char *test file = "/tmp/test lock'; 
int main() 


int file desc; 

int byte count; 

char *byte to write = *A'; 
struct flock region 1; 
struct flock region 2; 
int res; 


(2) 打开 一 个 文件 描述 符 : 
file desc = open(test file, O_RDWR | O CREAT, 0666); 
if (!Ifile desc) ( a 
fprintf(stderr, "Unable to open ts for read/write\n", test file); 
exit(EXIT FAILURE); 
) 


(3) 给 文件 添加 一 些 数据 : 


for(byte count = 0; byte count < 100; byte_count++) ( 
(void)write(file desc, byte to write, 1); 
) 
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(4) 把 文件 的 10~30 字 节 设 为 区 域 !1， 并 在 其 上 设置 共享 锁 : 


region_1.1_type = F RDLCK; 
region 1.1 whence = SEEK SET; 
region 1.1 start - 10; 
region 1.1 len - 20; 


(5) 把 文件 的 40~50 字 节 设 为 区 域 2， 并 在 其 上 设置 独占 锁 : 
region_2.1_type = F.WRLCK; 
region 2.1 whence = SEEK SET; 


region 2.1 start - 40; 
region 2.1 len = 10; 


(6) 现在 锁定 文件 ; 


printf('Process %d locking file\n", getpid()); 

res = fcntl(file desc, F SETLK, &region 1); 

if (res == -1) fprintf(stderr, "Failed to lock region 1\n"); 
res = fcntl(file desc, F SETLK, &region 2); 

if (res == -1) fprintf(stderr, "Failed to lock region 2\n"); 


然后 等 一 会 儿 : 
sleep(60); 


0 


printf ("Process %d closing fileW*, getpid()); 
close(file desc); 
exit (EXIT. SUCCESS) ; 

) 


程序 首先 创建 一 个 文件 ， 并 以 可 读 可 写 方式 打开 它 ， 然 后 再 在 文件 中 添加 一 些 数据 。 接 着 在 文 
件 中 设置 两 个 区 域 : 第 一 个 区 域 为 10~30 字 节 ， 使 用 共享 〈 读 ) 锁 ， 第 二 个 区 域 为 40~50 字 节 ， 使 用 
独占 ( 写 ) 锁 。 然 后 程序 调用 fcnt1 来 锁定 这 两 个 区 域 ， 并 在 关闭 文件 和 退出 程序 前 等 待 一 分 钟 。 

图 7-1 显 示 了 当 程 序 开始 等 待 时 文件 锁定 的 状态 。 
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这 个 程序 本 身 并 不 是 非 党 有用。 你 需要 用 第 二 个 程序 1ock4 .c 来 测试 锁 。 


Eng 测试 文件 上 的 锁 


在 本 例 中 ， 你 将 编写 一 个 程序 来 测试 可 能 会 用 在 文件 不 同 区 域 上 的 各 种 类 型 的 锁 。 
(1) 与 往常 一 样 ， 程 序 从 包含 头 文件 和 声明 变量 开始 : 


finclude «unistd.h» 
finclude <stdlib.h> 
finclude <stdio.h> 
finclude «fcntl.h» 


const char *test file = "/tmp/test lock*; 
#define SIZE TO TRY 5 


void show lock info(struct flock *to show); 


int main() 

{ 
int file des: 
int res; 
struct flock region to ti 
int start byte; 


(2) 打开 一 个 文件 描述 符 ; 


file desc = open(test file, O RDWR | O CREAT, 0666); 

if (!file desc) ( 
fprintf(stderr, "Unable to open $s for read/write", test file); 
exit(EXIT FAILURE); 








) 


for (start byte = 0; start byte < 99; start byte «- SIZE TO TRY) ( 


(3) 设置 希望 测试 的 文件 区 域 : 


region to test.l type = F WRLCK; 
region to test.l whence = SEEK SET; 
region to test.l start = start byte; 
region to test.l len = SIZE TO TRY; 
region to test.l pid = -1; 







printf(*Testing F WRLCK on region from &d to $dWn*, 
Start byte, start byte + SIZE TO TRY); 


(4) 现在 测试 文件 上 的 锁 : 


res = fcntl(file desc, F GETLK, &region to test); 
if (res -- -1) ( 
fprintf(stderr, "F GETLK failedWn*); 
exit(EXIT FAILURE); 


} 

if (region to test.l pid != -1) ( 
printf(*Lock would fail. F GETLK returned: in*); 
show lock info(&region to test); 
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} 


else ( 


printf(*F WRLCK - Lock would succeed in*); 
) 


(5) 用 共享 〈 读 ) 锁 重 复 测试 一 次 ， 再 次 设置 希望 测试 的 文件 区 域 : 


region to test.l type = F RDLCK; 

whence = SEEK SET; 

start = start byte; 

len = SIZE TO TRY; 

‘lpid = -1; 

printf(*Testing F_RDLCK on region from sd to d\n", 
start byte, start byte + SIZE TO TRY); 


(6) 再 次 测试 文件 上 的 锁 : 


res = fcntl(file desc, F GETLK, &region to test); 
if (res -- -1) ( 
fprintf(stderr, "F GETLK failedWn*); 
exit(EXIT FAILURE); 





} 
if (region to test.l pid != -1) ( 
printf('Lock would fail. F GETLK returned: n"); 
show lock info(&region to test); 
) 
else ( 
printf(*F RDLCK - Lock would succeedWn*); 
) 
) 
close(file desc); 
exit(EXIT SUCCESS); 
y 


void show lock info(struct flock *to show) ( 
printf('Vtl type êd, ", to show-»l type); 
printf('l whence &d, *, to show-»1 whence); 
printf('l start $d, *, (int)to show-»l start); 
printf(*l len Sd, (int)to show-»1 len); 


printf('l pid d\n", to show-»l pid); um 
$ 


为 了 测试 锁 ， 需 要 首先 运行 程序 lock3， 然 后 再 运行 程序 lock4 来 测试 锁 。 你 可 以 通过 在 后 
行程 序 1ock3 来 达到 这 个 目的 ， 下 面 是 执行 的 命令 : 


$ ./lock3 & 
$ process 1534 locking file 


命令 提示 符 又 出 现 了 ， 这 是 因为 lock3 是 在 后 台 运行 的 ， 紧 接着 你 用 下 面 的 命令 来 运行 程序 
lock4: 

$ ./lock4 

下 面 是 得 到 的 输出 ， 为 简洁 起 见 ， 输 出 内 容 做 了 一 些 省 略 : 


Testing F WRLOCK on region from 0 to 5 
F.WRLCK - Lock would succeed 
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Testing F RDLOCK on region from 0 to 5 
F.RDLCK - Lock would succeed 


Testing F WRLOCK on region from 10 to 15 

Lock would fail. F GETLK returned: 

l type 0, l whence 0, l start 10, 1 len 20, 1l pid 1534 
Testing F RDLOCK on region from 10 to 15 

F RDLCK - Lock would succeed 

Testing F WRLOCK on region from 15 to 20 

Lock would fail. F GETLK returned: 

l type 0, l whence 0, l start 10, 1 len 20, 1 pid 1534 
Testing F RDLOCK on region from 15 to 20 

F RDLCK - Lock would succeed 


Testing F WRLOCK on region from 25 to 30 

Lock would fail. F GETLK returned: 

l type 0, l whence 0, l start 10, 1 len 20, 1 pid 1534 
Testing F RDLOCK on region from 25 to 30 

F RDLCK - Lock would succeed 


Testing F WRLOCK on region from 40 to 45 

Lock would fail. F GETLK returned: 

l type 1, l whence 0, l start 40, l len 10, 1l pid 1534 
Testing F RDLOCK on region from 40 to 45 

Lock would fail. F GETLK returned: 

lotype 1, l whence 0, l start 40, 1 len 10, 1l pid 1534 


Testing F RDLOCK on region from 95 to 100 
F.RDLCK - Lock would succeed 


lock4 程 序 把 文件 中 的 每 5 个 字 节 分 成 一 组 ， 为 每 个 组 设置 一 个 区 域 结构 来 测试 锁 ， 然 后 通过 使 用 
这 些 结构 来 判断 对 应 区 域 是 否 可 以 被 加 写 锁 或 读 锁 。 返 回信 息 将 显示 造成 锁 请 求 失败 的 区 域 字 节 数 和 
从 字 节 0 开始 的 偏 移 量 。 因 为 返回 结构 中 的 1_pid 元 素 包含 当前 拥有 文件 锁 的 程序 的 进程 标识 符 ， 所 以 
程序 先 把 它 设置 为 -1 (一 个 无 效 值 )， 然 后 在 fcnt1 调 用 返回 后 检测 其 值 是 否 被 修改 过 。 如果 该 区 域 当 
前 未 被 锁定 ，1_pid 的 值 就 不 会 被 改变 。 

为 了 理解 程序 输出 的 含义 ， 你 需要 查看 程序 中 包含 的 头 文件 fcnt1.h (通常 是 /usr/include/ 
fcnt1.h)，1_type 的 值 为 1 对 应 的 定义 为 F_WRLCK，1_type 的 值 为 0 对 应 的 定义 为 F_RDLCK。 因 此 ， 
1_type 的 值 为 1 表明 锁 失 败 的 原因 是 已 经 存在 一 个 写 锁 了 ， 而 1_type 的 值 为 0 是 因为 已 经 存在 一 个 读 
锁 了 。 在 文件 中 未 被 lock3 程 序 锁定 的 区 域 上 ， 无 论 是 共享 锁 还 是 独占 锁 都 将 会 成 功 。 

你 可 以 看 到 10~30 字 节 上 可 以 设置 一 个 共享 锁 , 因为 程序 1ock3 在 该 区 域 上 设置 的 是 共享 锁 而 不 是 
独占 锁 。 而 在 40~50 字 节 的 区 域 上 ， 两 种 锁 都 将 失败 ， 因 为 lock3 已 经 在 该 区 域 上 设置 了 一 个 独占 
(F_WRLCK) 锁 。 

当 程序 lock4 执 行 结束 后 ， 你 需要 等 待 一 小 段 时 间 让 程序 lock3 完 成 它 的 sleep 调 用 并 退出 。 





7.24 “文件 锁 的 竞争 
现在 你 已 知道 如 何 测试 一 个 文件 上 的 已 有 锁 ， 下 面 让 我 们 来 看 看 当 两 个 程序 争夺 文件 同一 区 域 上 
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的 锁 时 会 发 生 什么 情况 。 你 将 再 次 用 1ock3 程 序 来 锁定 文件 ， 然 后 用 一 个 新 的 程序 1ock5 来 尝试 对 它 
进行 加 锁 。 为 了 使 这 个 示例 程序 更 完整 ， 你 还 将 在 lock5 程 序 中 添加 一 些 解锁 的 调用 。 


实验 文件 锁 的 竞争 


下 面 的 程序 lock5.c 的 作用 不 再 是 测试 文件 中 不 同 部 分 的 锁 状 态 ， 而 是 试图 对 文件 中 已 经 被 锁定 
的 区 域 再 次 加 锁 。 
(1) 在 #include 语 句 和 变量 声明 之 后 ， 打 开 一 个 文件 描述 符 : 


#include «unistd.h» 
#include «stdlib.h» 
#include <stdio.h> 
#include «fcntl.h» 


const char *test file = "/tmp/test lock*; 


int main() 

t 
int file desc; 
struct flock region to lock; 
int res; 


file desc = open(test file, O_RDWR | O.CREAT, 0666); 

if (!file desc) ( 
fprintf(stderr, "Unable to open $s for read/write|n', test file); 
exit (EXIT_FAILURE) ; 

) 


(2) 程序 的 其 余部 分 指定 文件 的 不 同 区 域 ， 并 尝试 在 它们 之 上 执行 不 同 的 锁定 操作 : 


region to lock.l type = F RDLCK; 
region to lock.l whence = SEEK SET; 
region to lock.l start - 10; 
region to lock.l len = 5; 
printf ("Process &d, trying F RDLCK, region $d to %d\n*, getpid(), 
(int)region to lock.l start, (int) (region to lock.l start + 
region to lock.l len]); 
res = fcntl(file desc, F SETLK, &region to lock); 
if (res == -1) ( 
printf(*Process &d - failed to lock region\n", getpid()); 


) else ( 
printf(*Process td - obtained lock regionin', getpid()); 








) 


region to lock.l type - F UNLCK; 
region to lock.l whence - SEEK SET; 
region to lock.l start - 10; 
region to lock.l len = 5; 
printf(*Process $d, trying F UNLCK, region $d to $din*, getpid(), 
(int)region to lock.l start, 
(int)(region to lock.l start + 
region to lock.l len)); 
res - fcntl(file desc, F SETLK, &region to lock); 
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res = fcntl(file desc, F SETLK, &region to lock]; 





if (res == -1) ( 
printf('Process $d - failed to unlock region(n', getpid()]; 
) else ( 


printf(*Process $d - unlocked regionin', getpid()); 
) 


region to lock.l type - F UNLCK; 
region to lock.l whence - SEEK SET; 
region to lock.l start 
region to lock.l len = 50; 
printf('Process $d, trying F UNLCK, region $d to $&dWn', getpid(), 
(int)region to lock.l start, 
(int) (region to lock.l start + 
region to lock.l len)); 
res = fcntl(file desc, F SETLK, &region to lock); 
if (res == -1) ( 
printf(*Process $d - failed to unlock regionin', getpid()); 
) else ( 
printf ("Proce 








$d - unlocked regionin*, getpid()); 
) 


region to lock.l type = F WRLCK; 
region to lock.l whence = SEEK SET; 
region to lock.l start = 16; 
region to lock.l len = 5; 
printf('Process $d, trying F WRLCK, region %d to $din', getpid(), 
(int)region to lock.l start, 
(int) (region to lock.l start + 

region to lock.l len)); 
res = fcntl(file desc, F SETLK, &region to lock]; 
if (res == -1) ( 

printf(*Process $d - failed to lock regionin', getpid()); 
) else ( 

printf ("Process &d - obtained lock on regioni, 








tpid()); 
? 


region to lock.l type - F RDLCK; 
region to lock.l whence - SEEK SET; 
region to lock.l start = 40; 
region to lock.l len = 1 
printf('Process &d, trying F RDLCK, region %d to $din', getpid(), 
(int)region to lock.l start, 
(int) (region to lock.l start + 

region to lock.l len)); 
res = fcntl(file desc, F SETLK, &region to lock); 
if (res == -1) ( 

printf(*Process td - failed to lock regionin', getpid()); 
) eise ( 

printf('Process &d - obtained lock on regionin', getpid()); 





) 


region to lock.l type - F WRLCK; 
region to lock.l whence - SEEK SET; 
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region to lock.l start = 16; 
region to lock.l len = 5; 
printf(*Process &d, trying F WRLCK with wait, region $d to tdWn", getpid(), 
(int)region to lock.1 start, 
(int) (region to lock.l start + 
region to lock.l len)); 
res = fcntl(file desc, F SETLKW, &region to lock); 
if (res == -1) ( 
printf(*Process &d - failed to lock regionWn', getpid()); 
) else ( 
printf(*Process &d - obtained lock on regionin', getpid()); 
) 


printf(*Process $d endingin*, getpid()); 
close(file desc); 
exit(EXIT. SUCCESS); 

Y 


如 果 首 先 在 后 台 运行 lock3 程 序 ， 然 后 立刻 运行 这 个 新 程序 : 
$ ./lock3 & 

$ process 227 locking file 

$ ./lock5 


你 得 到 的 输出 如 下 所 示 : 

Process 227 locking file 

Process 228, trying F RDLCK, region 10 to 15 
Process 228 - obtained lock on region 
Process 228, trying F UNLCK, region 10 to 15 
Process 228 - unlocked region 

Process 228, trying F UNLCK, region 0 to 50 
Process 228 - unlocked region 

Process 228, trying F WRLCK, region 16 to 21 
Process 228 - failed to lock on region 
Process 228, trying F RDLCK, region 40 to 50 
Process 228 - failed to lock on region 
Process 228, trying F WRLCK with wait, region 16 to 21 
Process 227 closing file 

Process 228 - obtained lock on region 
Process 228 ending 


首先 ， 这 个 程序 尝试 用 共享 锁 来 锁定 文件 中 10~15 字 节 的 区 域 。 这 块 区域 已 被 一 个 共享 锁 锁 定 ， 
但 共享 锁 允 许 同时 使 用 ， 因 此 加 锁 成 功 。 

它 然 后 解除 它 自己 对 这 块 区 域 的 共享 锁 ， 这 也 成 功 了 。 接 下 来 ， 这 个 程序 试图 解除 这 个 文件 前 50 
字 节 上 的 锁 ， 虽 然 它 实际 上 并 未 对 这 块 区 域 进行 锁定 ， 但 这 也 成 功 了 ， 因 为 虽然 这 个 程序 并 未 对 这 个 
区 域 加 锁 ， 但 解锁 请 求 最 终 的 结果 取决 于 这 个 程序 在 文件 的 头 50 个 字 节 上 并 没有 设置 任何 锁 。 

这 个 程序 接 下 来 试图 用 一 把 独占 锁 来 锁定 文件 中 16~21 字 节 的 区 域 。 由 于 这 块 区 域 上 已 经 有 了 一 
个 共享 锁 ， 独 占 锁 无 法 创建 ， 所 以 这 个 锁定 操作 失败 了 。 

然后 ， 程 序 又 尝试 用 一 把 共享 锁 来 锁定 文件 中 40~50 字 节 的 区 域 。 由 于 这 个 区 域 上 已 有 了 一 把 独 
占 锁 ， 因 此 这 个 锁定 操作 也 失败 了 。 

最 后 ， 程 序 再 次 尝试 在 文件 中 16~21 字 节 的 区 域 上 获得 一 把 独占 锁 ， 但 这 次 它 用 F_SETLKW 命 令 来 





2336  $&7* 数据 管理 





等 待 直到 它 可 以 获得 一 把 锁 为 止 。 于 是 程序 的 输出 就 会 遇 到 一 个 很 长 的 停顿 ， 直 到 已 锁 住 这 块 区 域 的 
lock3 程 序 因 为 完成 sleep 调 用 、 关 闭 文件 而 释放 了 它 先前 获得 的 所 有 锁 为 止 。1ock5 程 序 继续 执行 ， 
成 功 锁定 了 这 块 区 域 ， 最 后 它 也 退出 了 运行 。 





7.25 ”其 他 锁 命令 
还 有 另外 一 种 锁定 文件 的 方法 ， lockf 函 数 。 它 也 通过 文件 描述 符 进行 操作 。 其 原型 为 


#include <unistd.h> 


int lockf (int fildes, int function, off_t size_to_lock); 

function 参 数 的 取 值 如 下 所 示 。 

O F_ULOCK: 解锁 。 

口 F_Lock: 设置 独占 锁 。 

口 F_TLOCK: 测试 并 设置 独占 锁 。 

OFTEST: 测试 其 他 进程 设置 的 锁 。 

size_to_lock 参 数 是 操作 的 字 节 数 ， 它 从 文件 的 当前 偏 移 值 开始 计算 。 

lockf 有 一 个 比 fcnt1 函 数 更 简单 的 接口 , 这 主要 是 因为 它 在 功能 性 和 灵活 性 上 都 要 比 Ecnt 1 函数 
差 一 些 。 为 了 使 用 这 个 函数 ， 必 须 首先 搜寻 你 想 锁定 的 区 域 的 起 始 位 置 ， 然后 以 要 锁定 的 字 节 数 为 参 
数 来 调用 它 。 

与 文件 锁定 的 fcnt1 方 法 一 样 ，1ockf 设 置 的 所 有 锁 都 是 建议 锁 ， 它们 并 不 会 真正 地 阻止 你 读 写 
文件 中 的 数据 。 对 锁 的 检测 是 程序 的 责任 。 混 合 使 用 fcnc1 锁 和 lockf 锁 的 效果 未 被 定义 ， 因 此 你 必 
须 决定 使 用 哪 种 类 型 的 锁定 方法 并 坚持 用 下 去 。 

7.26 FE 

在 讨论 锁定 时 如 果 未 提 到 死 锁 的 危险 ， 那 么 这 个 讨论 就 不 能 算是 完整 的 。 假 设 两 个 程序 想 要 更 新 
同一 个 文件 。 它 们 需要 同时 更 新 文件 中 的 字 节 1 和 字 节 2。 程 序 A 选 择 首先 更 新 字 节 2， 然 后 再 更 新 字 节 
1。 程 序 B 则 是 先 更 新 字 节 1， 然 后 才 是 字 节 2。 

两 个 程序 同时 启动 。 程 序 A 锁 定 字 节 2， 而 程序 B 锁 定 字 节 1。 然 后 程序 A 尝 试 锁定 字 节 1， 但 因为 
这 个 字 节 已 经 被 程序 B 锁 定 ， 所 以 程序 A 将 在 那里 等 待 。 接 着 程序 B 尝 试 锁定 字 节 2， 但 因为 这 个 字 节 
已 经 被 程序 A 锁定 ， 所 以 程序 B 也 将 在 那里 等 待 。 

这 种 两 个 程序 都 无 法 继续 执行 下 去 的 情况 ， 就 被 称 为 死 锁 (deadlock 或 deadly embrace)。 这 个 问 
题 在 数据 库 应 用 程序 中 很 常见 ， 当 许多 用 户 频繁 访问 同一 个 数据 时 就 很 容易 发 生死 锁 。 大 多 数 的 商业 
关系 型 数据 库 都 能 够 检测 到 死 锁 并 自动 解 开 ， 但 Linux 内 核 不 行 。 这 时 就 需要 采取 一 些 外 部 干涉 手段 ， 
例如 强制 终止 其 中 一 个 程序 来 解决 这 个 问题 。 

程序 员 必 须 对 这 种 情况 提高 警惕 。 当 有 多 个 程序 都 在 等 待 获得 锁 时 ， 你 就 需要 非常 小 心地 考虑 是 
理会 发 生死 锁 。 在 本 例 中 ， 死 锁 是 非常 容易 避免 的 :两 个 程序 只 需要 使 用 相同 的 顺序 来 锁定 它们 需要 
的 字 节 或 锁定 一 个 更 大 的 区 域 即 可 。 

在 这 里 ， 我 们 没有 足够 的 篇 幅 未 讲解 开发 并 发 程序 的 原理 。 如 果 你 有 兴趣 了 解 更 多 ， 请 

AW Principles of Concurrent and Distributed Programming ( 《并 发 和 分 布 式 程序 设计 原理 》， 

M.Ben-Ari, Prentice Hall, 1990) . 
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7.3 ”数据库 


你 已 经 看 到 如 何 使 用 文件 来 储存 数据 ， 那 么 为 什么 还 要 用 数据 库 呢 ? 非常 简单 ， 因 为 在 有 些 情况 
下 ,数据库 的 特性 提供 了 解决 问题 的 更 好 方法 。 与 使 用 文件 来 存储 数据 相 比 ， 使 用 数据 库 有 如 下 两 方 
面 的 优势 。 
O 你 可 以 存储 长 度 可 变 的 数据 记录 ， 这 对 平面 的 、 非 结构 化 的 文件 来 说 实现 起 来 有 点 困难 。 
O 数据 库 使 用 索引 来 有 效 地 存储 和 检索 数据 。 这 样 做 的 一 个 显著 优点 是 这 个 索引 不 必 非 得 是 一 个 
简单 的 记录 号 一 一 这 在 平面 文件 中 很 容易 实现 ， 它 可 以 是 一 个 任意 的 字符 串 。 


7.8.1 dbm 数据 库 


所 有 版 本 的 Linux 以 及 大 多 数 的 UNIX 版 本 都 随 系统 带 有 一 个 基本 的 、 但 却 非常 高 效 的 数据 存储 例 
程 集 ， 它 被 称 为 Gbm 数 据 库 。dbm 数 据 库 适 合 于 存储 相对 比较 静态 的 索引 化 数据 。 一 些 数据 库 纯粹 主义 
者 可 能 会 认为 abm 根 本 算 不 上 是 一 个 数据 库 ， 充 其 量 就 是 一 个 索引 化 的 文件 存储 系统 。 但 X/Open 规 范 
把 abm 看 作 是 一 个 数据 库 ， 因 此 在 本 书 里 我 们 也 会 这 么 称呼 它 。 

1. abm 简 介 

尽管 一 些 免 费 的 关系 型 数据 库 ， 如 MySQL 和 PostgreSQL 使 用 越 来 越 广泛 ，dbm 数 据 库 仍 然 在 Linux 
中 扮演 着 一 个 重要 的 角色 。 那 些 使 用 RPM 的 Linux 发 行 版 本 ， 如 RedHat 和 SUSE， 就 是 用 abm 来 储存 已 
安装 软件 包 的 信息 。LDAP 的 开源 实现 OpenLDAP 也 可 以 使 用 abm 作 为 它 的 储存 机 制 。 与 更 加 完整 的 数 
据 库 产品 如 MySQL 相 比 ，abm 的 优势 在 于 它 是 一 个 很 轻 量 级 的 软件 ， 而 且 它 非常 容易 被 编译 进 一 个 可 
发 布 的 二 进 制 文件 中 ， 因 为 它 无 需 安装 独立 的 数据 库 服务 器 。 在 写作 本 书 的 时 候 ，Sendmail 和 Apache 
都 在 使 用 abm 数 据 库 。 

abm 数 据 库 可 以 使 用 索引 来 存储 可 变 长 的 数据 结构 ,然后 通过 索引 或 顺序 扫描 数据 库 来 检索 结构 。 
dbm 数 据 库 适 用 于 处 理 那些 被 频繁 访问 但 却 很 少 被 更 新 的 数据 ， 因 为 它 创建 数据 项 时 非常 慢 ， 而 检索 
时 非常 快 。 

讲 到 这 里 ， 我 们 遇 到 了 一 个 小 问题 : 多 年 以 来 ，abm 数 据 库存 在 着 各 种 不 同 的 版 本 ， 它 们 的 API 
接口 和 特性 都 有 一 些 细微 的 差别 。 既 有 最 初 的 Gbm 集 ， 又 有 “新 ”的 被 称 为 nabm 的 dbm 集 ， 还 有 GNU 
的 abm 实 现 gabm。GNU 的 实现 版 本 虽然 可 以 模拟 旧版 本 的 sbm 和 nabm 接 口 ， 但 其 本 身 的 接口 和 其 他 实 
现 版 本 相 比 ， 还 是 有 着 显著 的 不 同 。 不 同 的 Linux 发 行 版 本 自 带 的 Gbm 库 也 不 一 样 ， 虽 然 最 常见 的 选择 
是 带 有 gdbm 库 ， 因 为 它 可 以 模拟 其 他 两 种 接口 类 型 

在 这 里 ， 我 们 将 重点 介绍 nGbm 接 口 ， 因 为 它 已 由 X/Open 组 织 标准 化 ， 并 且 它 的 使 用 要 比 原始 的 
gdbm 实 现 简单 一 些 。 

2. 获得 dbm 

大 多 数 主流 的 Linux 发 行 版 都 会 默认 安装 gabm， 但 在 一 些 发 行 版 中 ， 你 可 能 需要 使 用 软件 包 管 理 
器 来 安装 相应 的 开发 库 。 例 如 ， 在 Ubuntu 中 ， 你 可 能 需要 使 用 Synaptic 软 件 包 管理 器 来 安装 
libgdbm-dev 软 件 包 ， 因 为 它 一 般 不 会 被 默认 安装 。 

如 果 想 要 查看 gdbm 开 发 包 的 源 代码 ， 或 者 使 用 的 Linux 发 行 版 没有 提供 预 编译 的 gabm 开 发 包 ， 你 
可 以 在 网 址 www.gnu.org/software/gdbm/gdbm.html 上 找到 dbm 的 GNU 实 现 gdbm。 

3. 故障 解决 和 重 装 abm 

本 章 假设 你 已 安装 了 dbm 的 GNU 实 现 gabm 和 nabm 兼 容 库 。Linux 发 行 版 通常 都 已 这 么 做 了 ， 但 如 
前 所 述 ， 你 可 能 必须 明确 安装 开发 库 软件 包 以 编译 使 用 ndbm 例 程 的 文件 。 
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遗憾 的 是 ， 对 于 不 同 的 Linux 发 行 版 ， 编 译 使 用 nabm 库 的 源 文件 所 需 的 包含 库 和 链接 库 略 有 不 同 ， 
所 以 , 虽然 你 已 安装 了 gdbm 和 nabm 兼 容 库 , 但 你 可 能 还 需要 经 过 实验 来 发 现 如 何 编译 这 些 源 文件 。 最 
和 常见 的 情况 是 ， 系 统 已 安装 了 gabm， 并 且 它 在 默认 情况 下 就 支持 了 napm 兼 容 模式 ，Red Hat 发 行 版 就 
是 这 样 的 。 在 这 种 情况 下 ， 你 需要 执行 如 下 操作 。 

(D) 在 C 源 文件 中 包含 头 文件 nabm.h。 

(2) 使 用 编译 行 选 项 -TI/usr/incluae/gdbm 包含 头 文件 目录 /usr/include/gdbm。 

(3) 使 用 编译 行 选项 -1gdbm 链 接 gabm 库 。 

如 果 这 不 起 作用 ， 一 种 常见 的 选择 (也 是 最 近 的 Ubuntu 和 SUSE 发 行 版 使 用 的 方法 ) 是 ;系统 已 
安装 了 gdbm, 但 在 需要 nabm 兼 容 模式 时 ， 你 必须 明确 地 指定 它 ， 并 且 你 可 能 需要 在 链接 主 函数 库 之 前 
链接 兼容 库 。 你 需要 做 的 具体 操作 如 下 所 示 。 

(D 在 C 源 文件 中 包含 头 文件 gdabm-nabm.h 而 不 是 nabm.h。 

(2) 使 用 编译 行 选 项 -TI/usr/incluaey/gdbm 包 含 头 文件 目录 /usryincludey/gdbm。 

(3) 使 用 编译 行 选项 -1gdbm_compat -1gdbm 链 接 其 他 的 gabm 兼 容 库 。 

可 下 载 的 wakefile 文 件 和 abm c 源 文件 都 被 默认 设置 为 使 用 第 一 种 选择 ， 但 它们 都 包含 注释 以 说 
明 如 何 可 以 通过 编辑 方便 地 切换 到 使 用 第 二 种 选择 。 在 本 章 的 剩余 部 分 ， 我 们 将 假设 你 的 系统 默认 就 
支持 ndbm 兼 容 模式 。 


7.3.2 dbm 例 程 


和 我 们 在 第 6 章 中 讨论 的 curses 函 数 库 一 样 ，abm 也 是 由 头 文件 和 库 文件 组 成 , 而且 库 文 件 必须 在 
程序 被 编译 时 链接 进来 。 库 文件 被 简称 为 sbm， 但 因为 我 们 通常 在 Linux 中 使 用 的 是 GNU 的 abm 实 现 ， 
所 以 我 们 需要 在 编译 行 中 使 用 选项 -1gabm 来 链接 这 个 实现 。 其 头 文件 是 nabm.h。 

在 开始 解释 每 个 dbm 函 数 之 前 ， 你 必须 明白 Gbm 数 据 库 能 够 做 什么 ,这 一 点 很 重要 。 一 旦 明白 了 这 
个 ， 你 就 能 更 好 地 理解 该 如 何 使 用 abm 函 数 。 

abm 数 据 库 的 基本 元 素 是 需要 储存 的 数据 块 以 及 与 它 关 联 的 在 检索 数据 时 用 作 关键 字 的 数据 块 。 
每 个 abm 数 据 库 必须 针对 每 个 要 存储 的 数据 块 有 一 个 唯一 的 关键 字 。 关 键 字 的 取 值 被 用 作 存 储 数据 的 
索引 。dbm 对 于 关键 字 和 数据 没有 限制 ， 对 使 用 超 长 关键 字 和 数据 的 情况 也 未 定义 任何 错误 。 规 范 允 
许 具体 实现 把 关键 字 / 数 据 对 的 长 度 限制 为 1 023 个 字 节 ， 但 具体 实现 通常 不 会 进行 限制 ， 这 是 因为 具 
体 实现 往往 要 比 技术 规范 所 要 求 的 更 灵活 。 

为 了 操纵 这 些 数据 块 ， 头 文件 ndbm.h 定 义 了 一 个 名 为 aatum 的 新 数据 类 型 。 该 类 型 确切 的 内 容 依 
赖 于 具体 实现 ， 但 它 至 少 包含 下 面 两 个 成 员 : 


void *dptr; 
size t dsize 


datum 是 一 个 用 typedef 语 句 定义 的 类 型 。 在 ndbm.h 文 件 中 还 为 Gbm 声 明了 一 个 类 型 定义 , 它 是 一 
个 用 来 访问 数据 库 的 结构 ， 其 作用 和 用 来 访问 文件 的 FILE 结构 很 相似 。abm 类 型 定义 的 内 部 结构 依赖 
于 具体 实现 ， 它 决 不 允许 被 直接 使 用 。 

在 使 用 dbm 库 时 ， 如 果 要 引用 一 个 数据 块 ， 你 必须 声明 一 个 Gatum 类 型 的 变量 ， 将 成 员 aptr 指 向 
数据 的 起 始点 ， 并 把 成 员 asize 设 为 包含 数据 的 长 度 。 无 论 是 待 存储 的 数据 或 是 用 来 访问 它 的 索引 都 
总 是 通过 这 个 qatum 类 型 来 引用 。 

你 最 好 将 Gbm 类 型 看 作为 类 似 于 FILE 的 类 型 . 当 打 开 一 个 dbm 数 据 库 时 ,通常 会 创建 两 个 物理 文件 ， 
它们 的 后 级 分 别 是 .pag 和 .air， 并 返回 一 个 Gbm 指 针 ， 它 被 用 来 访问 这 两 个 文件 。 这 两 个 文件 决 不 应 
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该 被 直接 读 写 ， 对 它们 的 访问 只 能 通过 abm 例 程 来 进行 。 
在 一 些 实现 中 ， 这 两 个 文件 被 合并 到 一 起 ， 打 开 数 据 库 只 会 创建 一 个 文件 。 
如 果 对 SQL 数据 库 很 熟悉 ， 你 会 发 现 abm 数 据 库 没有 与 之 关联 的 表格 或 列 结构 。 这 些 结构 对 于 abm 
数据 库 来 说 并 不 是 必需 的 ， 因 为 abm 不 仅 对 待 存储 的 每 个 数据 项 没有 固定 长 度 的 要 求 ， 而 且 对 数据 的 
内 部 结构 也 无 要 求 。abm 数 据 库 工 作 在 非 结构 化 的 二 进 制 数据 块 基础 上 。 


7.8.3 dbm 访问 函数 


现在 我 们 已 介绍 了 abm 库 工作 的 基础 ， 下 面 我 们 可 以 来 具体 看 看 它 提供 的 函数 。 主 要 的 abm 函 数 的 
原型 如 下 所 示 : 

#include «ndbm.h» 

DBM *dbm open(const char *filename, int file open flags, mode t file mode); 

int dbm store(DBM *database descriptor, datum key, datum content, int store mode); 

datum dbm fetch(DBM *database descriptor, datum key); 

void dbm close(DBM *database descriptor); 


1. dbm_open 函 数 

这 个 函数 用 来 打开 已 有 的 数据 库 ， 也 可 以 用 来 创建 新 数据 库 。filename 参 数 是 一 个 基本 文件 名 ， 
它 不 包含 .dir 或 .pag 后 级 。 

其 余 的 参数 和 第 3 章 中 的 open 函 数 的 第 二 个 和 第 三 个 参数 一 样 。 你 可 以 使 用 相同 的 #define 定 义 。 
第 二 个 参数 控制 数据 库 的 读 、 写 或 读 / 写 权限 。 如 果 要 创建 一 个 新 的 数据 库 ， 这 个 标志 必须 与 0_CREAT 
进行 二 进 制 或 才 允 许 文 件 被 创建 。 第 三 个 参数 指定 将 被 创建 的 文件 的 初始 权限 。 

dbm_open 返 回 一 个 指向 pBM 类 型 的 指针 。 它 被 用 于 所 有 后 续 对 数据 库 的 访问 。 如 果 失 败 ， 它 将 返 
[E] (DBM *)0。 

2. dbm storeifit 

你 用 这 个 函数 把 数据 存储 到 数据 库 中 。 如 前 所 述 ， 所 有 数据 在 存储 时 都 必须 有 一 个 唯一 的 索引 。 
为 了 定义 你 想 要 存储 的 数据 和 用 来 引用 它 的 索引 ， 你 必须 设置 两 个 datum 类 型 的 参数 ， 一 个 用 于 引用 
索引 ， 一 个 用 于 实际 数据 。 最 后 一 个 参数 score_mode 用 于 控制 当 试图 以 一 个 已 有 的 关键 字 来 存储 数 
据 时 会 发 生 的 情况 。 如 果 它 被 设置 为 abm_insert， 存 储 操作 将 失败 并 且 dbm_store 返 回 !。 如 果 它 被 
设置 为 Gbm_replace, 则 新 数据 将 条 盖 已 有 数据 并 且 Gbm_store 返 回 0。。 当 发 生 其 他 错误 时 , dbm_store 
将 返回 一 个 负 值 。 

3. abm_fetch 函 数 

dbm_fetch 函 数 用 于 从 数据 库 中 检索 数据 . 它 使 用 一 个 先前 Gbm_open 调 用 返回 的 指针 和 一 个 指向 
关键 字 的 datum 类 型 结构 作为 其 参数 。 它 返回 一 个 Gatum 类 型 的 结构 。 如 果 在 数据 库 中 找到 与 这 个 关 
键 字 关联 的 数据 ， 返 回 的 datum 结 构 的 Gptr 和 asize 成 员 的 值 将 被 设 为 相应 数据 的 值 。 如 果 没 有 找到 
关键 字 ，dptr 将 被 设置 为 nu11。 


要 记 住 的 是 ，dbm_fetch 返 回 的 Gatum 类 型 结构 中 仅仅 包含 一 个 指向 数据 的 指针 。 实 
际 数 据 依然 保存 在 Gbm 库 的 本 地 存储 空间 中 . 你 在 继续 调用 dibm 务 数 前 ， 必 须 把 数据 复制 到 
程序 的 变量 中 才 行 。 


4. dbm closeififü 
这 个 函数 关闭 用 abm_open 打 开 的 数据 库 。 它 的 参数 是 先前 abm_open 调 用 返回 的 sbm 指 针 。 


























在 学 习 了 adbm 数 据 库 的 基本 函数 之 后 ， 你 可 以 开始 编写 第 一 个 abm 程 序 abml .< 了 。 在 这 个 程序 中 ， 
你 将 使 用 一 个 名 为 est_data 的 结构 。 
(1) 程序 的 开始 部 分 是 #tincluae 语 句 、#aefine 定 义 、main 函 数 和 rest_data 结 构 的 声明 : 


#include <unistd.h> 
#include <stdlib.h> 
#include <stdio.h> 
#include «fcntl.h» 


#include «ndbm.h» 

/* On some systems you need to replace the above with 
#include «gdbm-ndbm.h» 

TL 

finclude <string.h> 


$define TEST DB FILE '/tmp/dbml test" 
fdefine ITEMS USED 3 


struct test data ( 





int main() 

t 

(2) 在 main 函 数 中 ， 设 置 了 items_to_store 和 items_received 两 个 结构 ， 还 设置 了 关键 字 字符 
串 和 adatum 结 构 : 


struct test data items to store[ITEMS USED]; 
struct a item retrieved; 





char key to use[20]; 
int i, result; 


datum key datum; 
datum data datum; 
DBM *dbm ptr; 
Q) 在 声明 了 一 个 指向 Gbm 类 型 结构 的 指针 后 , 现在 打开 测试 数据 库 用 来 读 写 , 如 果 需 要 就 创建 它 : 


dbm ptr = dbm open(TEST DB FILE, O_RDWR | O.CREAT, 0666); 
if (!dbm ptr) ( 
fprintf(stderr, "Failed to open databasein*); 
exit(EXIT FAILURE); 
) 


(4) 现在 添加 一 些 数据 到 items_to_store 结 构 中 : 


memset(items to store, '\0', sizeof(items to store)); 
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strcpy(items to store[0].misc chars, 
items to store[0].any integer = 47; 
strcpy(items to store[0].more chars, 


strcpy(items to store[1].misc chars, 
items to store[1].any integer - 13; 
Strcpy(items to store[1].more chars, 


Strcpy(items to store[2].misc chars, 
items to store[2].any integer - 3; 
strcpy(items to store[2].more chars, 





"First!*); 
*foo*); 
"bar*); 
*unlucky?*); 
*Third*); 


"baz*); 


(5) 你 需要 为 每 个 数据 项 建立 一 个 供 以 后 引用 的 关键 字 。 它 被 设 为 每 个 字符 串 的 头 一 个 字母 加 上 
整数 。 这 个 关键 字 由 key_datum 标 识 ， 而 aata_datum 则 指向 items_ro_store 数 据 项 。 然 后 将 数据 存 
储 到 数据 库 中 : 


for (i = 0; i < ITEMS USED; i++) ( 
Sprintf(key to use, "i&c$cid", 
items to store[i].misc chars[0], 
items to store[i].more chars[0], 
items to store[i].any integer); 


key datum.dptr = (void *)key to i 
key datum.dsize - strlen(key to use); 

data datum.dptr = (void *)&items to store[i]; 
data datum.dsize - sizeof(struct test data); 





result = dbm store(dbm ptr, key datum, data datum, DBM REPLACE); 
if (result != 0) ( 
fprintf(stderr, 'dbm store failed on key %s\n", key to use); 
exit(2); 


) 
(6) 接 下 来 ， 查 看 是 否 可 以 检索 这 个 新 存 入 的 数据 。 最 后 ， 关 闭 数据 库 : 
sprintf(key to use, "busd", 13); 


key datum.dptr - key to use; 
/datum.dsize = strlen(key to use); 





data datum = dbm fetch(dbm ptr, key datum); 
if (data datum.dptr) ( 
printf('Data retrieved in"); 
memcpy(&item retrieved, data datum.dptr, data datum.dsize); 
printf ("Retrieved item - $s 4d $sWn*, 
item retrieved.misc chars, 
item retrieved.any integer, 
item retrieved.more chars); 





) 
else ( 
printf(*No data found for key s\n“, key to use); 
) 
dbm close(dbm ptr); 
exit(EXIT SUCCESS); 
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编译 并 运行 这 个 程序 ， 它 的 输出 如 下 所 示 : 

$ gcc -o dbml -I/usr/include/gdbm dbml.c -1gdbm 
$ ./dbml 

Data retrieved 

Retrieved item - bar 13 unlucky? 


如 果 gabm 是 以 兼容 模式 安装 的 ， 这 就 是 你 将 获得 的 输出 结果 。 如 果 编 译 失败 ， 你 可 能 需要 修改 源 
文件 中 的 #incluqe 语 句 ， 按 照 源 文件 中 注释 说 明 的 方法 ， 用 gabm-ndbm.h 文 件 替换 nabm.h， 并 在 编 
译 源 文 件 时 ， 在 链接 主 函 数 库 之 前 先 链接 兼容 库 ， 如 下 所 示 : 


$ gcc -o dbml -I/usr/include/gdbm dbmi.c -lgdbm compat -lgdbm 


首先 ， 打开 数据 库 ， 如 果 需 要 就 创建 它 。 接 着 ,填充 作为 测试 数据 的 items_to_store 的 3 个 成 员 。 
针对 每 个 成 员 ， 你 分 别 创建 一 个 案 引 关键 字 。 为 简单 起 见 ， 你 使 用 两 个 字符 趾 的 头 一 个 字符 再 加 上 整 
数 来 构成 关键 字 。 

然后 ， 设 置 两 个 Gatum 结 构 ， 一 个 用 于 关键 字 ， 另 一 个 用 于 存储 的 数据 。 在 把 3 个 数据 项 存储 到 数 
据 库 中 之 后 ， 你 构建 一 个 新 的 关键 字 并 设置 一 个 datum 结 构 来 指向 它 。 然 后 ， 使 用 这 个 关键 字 来 从 数 
据 库 中 检索 数据 。 通 过 检查 返回 的 datum 结 构 中 的 Gptr 成 员 是 否 为 nu11， 来 判断 检索 是 否 成 功 。 假 设 
它 不 是 nul1， 你 就 可 以 把 检索 到 的 数据 ( 它 可 能 储存 在 dbm 库 的 内 部 空间 中 ) 复制 到 你 自己 的 结构 中 。 
注意 ， 要 使 用 abm_fecch 返 回 的 长 度 值 《如果 不 这 样 做 ， 并 且 使 用 的 是 可 变 长 数据 ， 你 可 能 就 会 复制 
根本 不 存在 的 数据 )。 最 后 ， 打 印 检索 到 的 数据 来 验证 是 否 正确 获取 了 数据 。 





7.3.4 其 他 abm 函数 
现在 你 已 知道 了 主要 的 abm 函 数 ， 本 节 我 们 将 介绍 用 于 ab 数据库 的 一 些 其 他 函数 ; 
int dbm delete(DBM *database descriptor, datum key); 





int dbm clearerr(DBM *database descriptor); 

datum dbm firstkey(DBM *dat. 

datum dbm nextkey(DBM *databas 

1. dbm deleteifiit 

Gbm_delete 函 数 用 于 从 数据 库 中 删除 数据 项 。 与 Gbm_fetch 一 样 ， 它 也 使 用 一 个 指向 关键 字 的 
qdatum 类 型 结构 作为 其 参数 , 但 不 同 的 是 , 它 是 用 于 删除 数据 而 不 是 用 于 检索 数据 . 它 在 成 功 时 返回 0。 

2. dbm error% 

dbm_error 函 数 只 是 用 于 测试 数据 库 中 是 否 有 错误 发 生 ， 如 果 没 有 就 返回 0。 

3. dbm clearerrifift 

dbm_clearerr 函 数 用 于 清除 数据 库 中 所 有 已 被 置 位 的 错误 条 件 标志 。 

4. dbm_firstkey 和 dbm_nextkey 函 数 

这 两 个 函数 一 般 成 对 使 用 来 对 数据 库 中 的 所 有 关键 字 进 行 扫描 。 它 们 需要 的 循环 结构 如 下 所 示 : 


DBM *db ptr; 
datum key; 






lescriptor); 


for(key = dbm firstkey(db ptr); key.dptr; key = dbm nextkey(db ptr)]; 
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实验 检索 和 删除 


在 本 例 中 ， 使 用 上 面 介绍 的 新 函数 对 abml .c 做 一 些 改进 。 下 面 是 dbm2 .c 的 源 代码 : 
(O) 复制 一 份 abml .c， 打 开 它 进行 编辑 。 修 改 #define TEST_DB_FILE 一 行 : 


#include <unistd.h> 
#include «stdlib.h» 
#include <stdio.h> 
#include «fcntl.h» 
#include <ndbm.h> 

#include «string.h» 





#define TEST DB FILE "/tmp/dbm2 test* 
#define ITEMS USED 3 


(2) 然后 只 需要 修改 检索 数据 的 部 分 : 


/* now try to delete some data */ 
sprintf(key to use, "buèd", 13); 
key datum.dptr - key to use; 
key datum.dsize = strlen(key to use); 


if (dbm delete(dbm ptr, key datum) == 0) ( 
printf(*Data with key %s deletedin*, key to use); 
) 
else ( 
printf(*Nothing deleted for key %s\n", key to use); 
) 
for (key datum = dbm firstkey(dbm ptr); 
key. datum.dptr; 
key datum - dbm nextkey(dbm ptr]) ( 
data datum - dbm fetch(dbm ptr, key datum); 
if (data datum.dptr) ( 
printf ("Data retrievedin*); 
memcpy(&item retrieved, data datum.dptr, data datum.dsize); 
printf("Retrieved item - $s td &s n*, 
item retrieved.misc chars, 
item retrieved.any integer, 
item retrieved.more chars); 
) 


else ( 
printf(*No data found for key s\n", key to use]; 


y 
其 输出 为 : 
$ ./dbm2 


Data with key bul3 deleted 
Data retrieved 

Retrieved item - Third 3 baz 
Data retrieved 

Retrieved item - First! 47 foo 
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这 个 程序 的 第 一 部 分 同 前 面 的 例子 完全 一 样 ， 只 是 往 数据 库 里 储存 一 些 数据 。 然 后 构建 一 个 关键 
字 来 匹配 第 二 个 数据 项 ， 并 把 它 从 数据 库 中 删除 。 

接 下 来 , 这 个 程序 使 用 dbm_firstkey 和 dbm_nextkey 依 次 访问 数据 库 中 的 每 个 关键 字 , 并 检索 数 
de. 注意， 数据 的 获取 并 不 是 按 序 的 ， 按 关键 字 的 顺序 检索 数据 并 不 意味 着 获取 的 数据 是 有 序 的 ， 它 
只 是 一 种 扫描 所 有 数据 项 的 方式 。 
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在 学 习 了 环境 和 数据 管理 之 后 ， 现 在 是 时 候 改进 这 个 应 用 程序 了 。abm 数 据 库 看 起 来 很 适合 于 存 
储 CD 资料 ， 所 以 下 面 将 使 用 abm 来 实现 数据 存储 。 


7.4.1 更 新 设计 


因为 这 次 的 更 新 会 涉及 大 量 代码 的 重 写 ， 所 以 现在 是 个 重新 审视 设计 决策 以 查看 哪些 地 方 需要 改 
进 的 好 时 机 。 虽 然 在 文件 中 以 逗号 分 隔 变量 来 存储 信息 是 一 种 在 shell 中 很 容易 实现 的 方式 ， 但 这 样 做 
的 局 限 性 也 很 大 ， 因 为 许多 CD 标题 和 曲目 都 包含 逗号 。 你 可 以 通过 使 用 apm 数据库 来 完全 放弃 这 种 分 
隔 方法 ， 这 也 是 我 们 需要 改变 的 一 个 设计 元 素 。 

将 CD 资料 分 为 标题 和 曲目 两 个 部 分 ， 并 用 不 同 的 文件 来 分 别 保存 它们 。 

前 面 的 实现 多 少 都 存在 着 这 样 一 个 问题 ， 即 将 应 用 程序 的 数据 访问 部 分 和 用 户 接口 部 分 混在 了 一 
起 ， 这 与 程序 全 实现 在 一 个 文件 中 有 很 大 的 关系 。 在 这 个 新 的 实现 中 ， 你 将 用 一 个 头 文件 来 描述 数据 
和 用 于 访问 它 的 例 程 ， 并 将 用 户 接口 代码 和 数据 处 理 代码 分 别 放 到 两 个 文件 中 去 。 

虽然 可 以 继续 用 curses 来 实现 用 户 接口 ,但 本 次 实现 将 返回 到 简单 的 基于 行 的 系统 。 这 不 仅 使 应 
用 程序 的 用 户 接口 部 分 既 短小 又 简单 ， 而 且 可 以 把 精力 集中 到 其 他 实现 方面 上 

虽然 还 不 能 在 abm 代 码 中 使 用 SQL 语句 ， 但 可 以 使 用 SQL 术语 以 更 正规 的 方式 来 描述 新 数据 库 。 
如 果 还 不 熟悉 SQL 语 句 ， 不 用 担心 ， 我 们 会 解释 这 些 定义 。 你 还 将 在 第 8 章 中 看 到 更 多 对 SQL 语 句 的 介 
绍 。 表 可 以 用 下 面 的 代码 来 描述 : 

CREATE TABLE cdc entry ( 

Catalog CHAR(30) PRIMARY KEY REFERENCES cdt entry(catalog), 
title CHAR(70),, 
type CHAR(30), 
artist ^ CHAR(70) 
J; 








CREATE TABLE cdt_entry ( 
catalog CHAR(30) REFERENCES cdc entry(catalog), 
track no INTEGER, 
track txt CHAR(70), 
PRIMARY KEY(catalog, track no) 
J; 


这 个 非常 简洁 的 描述 表明 数据 域 的 名 字 和 长 度 。cac_entry 表 中 每 个 记录 都 有 一 个 唯一 的 
catalog 列 。cdt_entry 表 中 曲目 号 不 能 为 零 ， 而 且 catalog 和 track_no 两 列 的 组 合 是 唯一 的 。 你 将 
在 下 一 节 的 代码 中 看 到 这 些 描述 被 定义 为 typedef struct 结 构 。 
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7.4.2 使 用 dbm 数据 库 的 CD 唱片 应 用 程序 


你 现在 将 通过 使 用 abm 数 据 库存 储 信息 的 方法 来 重新 实现 应 用 程序 。 整 个 应 用 程序 共有 3 个 文件 ， 
它们 是 ca_data.h、app_ui.c 和 cad_access.c。 

你 还 将 把 用 户 接口 重 写 为 命令 行程 序 。 在 本 书 的 后 面 章节 中 ,你 将 看 到 使 用 不 同 的 客户 /服务 器 机 
制 来 实现 应 用 程序 ， 并 最 终 将 其 实现 为 一 个 能 够 通过 Web 浏 览 器 跨 网 络 访问 的 应 用 程序 ， 到 那 时 ， 你 
还 将 重用 这 里 的 数据 库 接口 和 一 部 分 的 用 户 接口 。 把 接口 转换 为 更 简单 的 命令 行 驱动 接口 ， 使 你 能 更 
容易 关注 应 用 程序 最 重要 的 部 分 ， 而 不 是 用 户 接口 。 

你 将 在 后 面 的 章节 中 看 到 ， 数 据 库 的 头 文件 caQ_aaca.h 和 来 自 文件 ca_access.c 里 的 函数 被 多 次 
重用 。 








请 记 住 ， 有 些 Linux 发 行 版 需要 稍微 不 同 的 编译 选项 ， 如 在 C 源 文件 中 包含 头 文件 
gdbm-ndbm.h 而 不 是 ndbm.h， 使 用 -lgdbm_compat -1gdbm 而 不 是 只 使 用 -1gdbm。 如 果 你 
的 Linux 发 行 版 就 属于 这 种 情况 ， 就 需要 对 文件 access.c 和 Makefile 进 行 适当 的 修改 . 











实验 ca data.h 

我 们 从 头 文件 开始 ， 它 定义 了 数据 的 结构 和 用 于 访问 这 些 数据 的 例 程 。 

(1) 下 面 是 CD 数据 库 的 数据 结构 的 定义 。 它 定义 了 组 成 数据 库 的 两 个 表 的 结构 和 大 小 。 首 先 定义 
了 儿 个 将 会 用 到 的 数据 域 长 度 以 及 两 个 结构 :一 个 用 于 标题 数据 项 ， 另 一 个 用 于 曲目 数据 项 : 

/* The catalog table */ 


#define CAT_CAT_LEN 30 
#define CAT_TITLE_LEN 70 
#define CAT TYPE LEN 30 


define CAT ARTIST LEN 70 


typedef struct ( 
char catalog[CAT CAT LEN * 1]; 
Char title[CAT TITLE LEN + 1]; 
Char typelCAT TYPE LEN + 1]; 
char artist[CAT ARTIST LEN « 1]; 
) cdc, entry; 


/* The tracks table, one entry per track */ 
#define TRACK CAT LEN CAT CAT LEN 
#define TRACK TTEXT LEN 70 


typedef struct ( 
char catalog[TRACK CAT LEN + 1]; 
int track no; 
Char track txt[TRACK TTEXT LEN + 1]; 
) cdt entry; 
Q) 在 定义 了 一 些 数据 结构 后 ， 你 可 以 开始 定义 一 些 需要 的 访问 例 程 了 。 函 数 名 中 包含 cdc_ 的 函 
数 负 责 处 理 标题 数据 项 ， 包 含 cat_ 的 函数 负责 处 理 曲 目 数据 项 : 


注意 ， 有 些 函 数 直接 返回 数据 结构 。 你 可 以 通过 强制 设置 这 些 结构 的 内 容 为 空 ， 来 表 
明 函 数 调用 失败 。 
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/* Initialization and termination functions */ 
int database initialize(const int new database); 
void database close(void); 


/* two for simple data retrieval */ 
Cdc.entry get các entry(const char *cd catalog ptr); 
cát entry get cdt entry(const char *cd catalog ptr, const int track no); 


/* two for data addition */ 
int add cdc entry(const các entry entry to add); 
int add cdt entry(const cdt entry entry. to add); 


/* two for data deletion */ 
int del cdc entry(const char *cd catalog ptr); 
int del cát entry(const char *cd catalog ptr, const int track no); 


/* one search function */ 
Cdc-entry search cdc entry(const char *cd catalog ptr, int *first call ptr); 


| perm 
现在 开始 介绍 用 户 接口 。 这 部 分 程序 相对 来 说 比较 简单 ， 它 实现 在 -个 单独 的 文件 中 ， 你 将 用 它 
来 访问 数据 库 函数 。 
(D) 同 往常 一 样 ， 从 头 文件 开始 : 
#define _XOPEN_SOURCE 





#include <stdlib.h> 
#include <unistd.h> 
#include <stdio.h> 
#include <string.h> 


#include *cà data.h* 


define TMP STRING LEN 125 /* this number must be larger than the biggest 
single string in any database structure */ 


(2) 用 typedef 语 句 定义 菜单 选项 。 这 要 比 用 #Gefine 语 句 定义 常量 的 方法 好 ， 因 为 它 允 许 编译 器 
检查 菜单 选项 变量 的 类 型 : 


typedef enum ( 
mo invalid, 
mo add cat, 
mo add tracks, 
mo del cat, 
mo. find cat, 
mo list cat tracks, 
mo, del tracks, 
mo count entries, 
mo exit 

) menu options; 


O) 现在 开始 编写 各 种 局 部 函数 的 原型 。 记 住 ， 实 际 访问 数据 库 的 函数 的 原型 是 通过 头 文件 
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ca_qata.h 包 含 进来 的 : 


Static int command mode(int argc, char *argv[]); 

static void announce (void); 

Static menu options show menu(const các entry *current. cdc); 

static int get confirm(const char *question); 

Static int enter new cat entry(cdc entry *entry to update); 

static void enter new track entries(const cdc entry *entry to add to); 
Static void del cat entry(const cdc entry *entry to delete 
static void del track entries(const cdc entry *entry to delete); 
static cdc entry find cat(void); 

Static void list tracks(const cdc entry *entry to use); 

static void count all entries (void); 

static void display cdc(const cdc entry *cdc to show); 

static void display cdt(const cdt entry *cdt to show); 

static void strip return(char *string to strip); 


(4) 最 后 ， 到 了 main 函 数 。 它 先 对 current_cdc_entry 结 构 进行 初始 化 ， 用 它 来 保存 当前 选中 的 
CD 标题 项 。 还 解析 了 命令 行 ， 宣 布 正在 运行 的 是 哪个 程序 ， 并 初始 化 数据 库 : 


void main(int argc, char *argv[]) 
t 





menu_options current_option; 
cdc_entry current, cdc entry; 
int command result; 


memset(&current cdc entry, 'X0', sizeof(current cdc entry)]; 


if (argc > 1) { 
command result = command mode(argc, argv); 
exit(command result); 

) 


announce(); 


if (!database initialize(0)) ( 
fprintf(stderr, "Sorry, unable to initialize database|n"); 
fprintf(stderr, "To create a new database use %s -i\n", argv[0]); 
exit(EXIT FAILURE); 

H 


(5) 现在 已 准备 好 处 理 用 户 输入 了 。 进 入 一 个 循环 ， 等 待 用 户 选择 一 个 菜单 选项 ， 然 后 处 理 它 ， 
直到 用 户 选择 退出 选项 为 止 。 注 意 ， 把 current_cdc_entry 结 构 传递 给 show_menu 函 数 。 这 是 为 了 让 
菜单 选项 能 够 根据 用 户 当前 选择 的 标题 项 做 相应 的 改变 : 


while(current option != mo exit) ( 
current option = show menu(&current cdc, entry); 


switch(current option) ( 
case mo add cat: 
if (enter new cat entry(&current cdc entry)) ( 
if (tadd các entry(current cdc entry)) ( 
fprintf(stderr, "Failed to add new entry"); 
memset(&current cdc entry, '\0', 








sizeof(current cdc entry)); 
) 
) 
break; 

case mo add tracks: 
enter new track entries(&current cdc entry); 
break; 

case mo del cat: 
del. cat, entry (&current. cdc, entry); 
break; 

Case mo find cat: 
current cdc entry = find cat(); 
break; 

Case mo list cat. tracks: 
list, tracks (&current cdc entry); 
break; 

case mo del tracks: 
del track entries(&current, cdc, entry); 
break; 

Case mo count entries: 
count, all entries(); 
break; 

case mo exit: 
break; 

case mo invalid: 

^ break; 

default: 

break; 
) /* switch */ 
) /* while */ 


(© 主 循环 退出 时 ， 关 闭 数据 库 并 退回 到 环境 。announce 函 数 用 于 输出 欢迎 辞 : 


database close(); 
exit(EXIT SUCCESS); 
) /* main */ 





static void announce(void) 


printf("\n\nWelcome to the demonstration CD catalog database V 
program"); 
) 


(7) 下 面 列 出 了 show_menu 函 数 的 内 容 。 这 个 函数 通过 标题 名 的 第 一 个 字符 来 检查 当前 标题 项 是 否 
被 选中 。 如 果 选择 了 一 个 标题 项 ， 用 户 将 看 到 更 多 的 菜单 选项 : 
注意 ， 现 在 要 用 数字 来 选择 菜单 项 ， 而 不 像 在 前 两 个 例子 中 那样 使 用 首 字母 。 


static menu options show menu(const cdc entry *cdc selected) 
t 














Char tmp str[TMP STRING LEN + 1]; 
menu options option chosen - mo invalid; 


while (option chosen -- mo invalid) ( 
if (cdc selected-»catalog[0]) ( 
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} 


printf("\n\nCurrent entry: *); 

printf('$s, $s, ès, $sin', cdc selected-»catalog, 
Các. selected-»title, 
các, selected-»type, 
các selected-»artist); 


printf(*WAn*); 

printf(*l - add new CDWn*); 

printf(*2 - search for a CD\n"); 

printf(*3 - count the CDs and tracks in the databasein"); 
printf('4 - re-enter tracks for current CDin*); 
printf(*5 - delete this CD, and all its tracksin*]; 
printf(*6 - list tracks for this CDWn*); 

printf(*q - quitin* 
printf(*WnOption: * 
fgets(tmp str, TMP STRING LEN, stdin); 








switch(tmp str[0]) ( 

option chosen 
option, chosen 
option chosen 
option chosen 
option chosen 
option chosen 
option chosen 


mo add cat; break; 





mo list cat tracks; break; 
mo exit; break; 





) 


else ( 


printf (*"\n\n"); 

printf(*l - add new CD\n"); 
printf(*2 - search for a CD\n"); 
printf(*3 - count the CDs and tracks in the database n"); 
printf(*q - quitWn*); 

printf('WOption: *); 

fgets(tmp str, TMP STRING LEN, stdin); 
switch(tmp str[0]) ( 

option chosen - mo add cat; break; 
option chosen = mo find cat; break, 






case option chosen - mo count entries; break; 
case 'q': option chosen = mo exit; break; 
) 
} 
) /* while */ 


return(option chosen); 
) 


(8) 你 需要 在 多 个 地 方 询问 用 户 ， 让 用 户 确认 他 的 请 求 。 我 们 并 未 让 这 段 提问 代码 多 次 出 现在 程 


序 中 ， 而 是 抽取 这 段 代码 组 成 一 个 单独 的 函数 get_confirm: 


Static int get confirm(const char *question) 
{ 
char tmp_str[TMP_STRING_LEN + 1]; 


250 第 7 章 数据 管理 





printf(*S$s', question); 

fgets(tmp str, TMP STRING LEN, stdin); 

if (tmp str[0] == 'Y' || tmp str[0] == 'y') ( 
return(1); 


return(0) ; 
) 


(9) 函数 enter_new_cat_entry 的 作用 是 让 用 户 输入 一 个 新 的 标题 项 .你 并 不 想 保 存 由 fgets 函 数 
返回 的 换行 符 ， 所 以 把 它 去 掉 : 


注意 ,你 没有 使 用 gets 示 数 ,因为 它 无 法 检查 缓存 区 是 否 溢出 ,你 应 总 是 避免 使 用 gets 
函数 ! 














Static int enter new cat entry(cdc entry *entry to update) 
t 

cdc entry new entry; 

char tmp str[TMP STRING LEN + 1]; 


memset(&new entry, '\0', sizeof(new entry)); 


printf("Enter catalog entry: *); 

(void)fgets(tmp str, TMP STRING LEN, stdin); 

Strip return(tmp str); 

Strncpy(new entry.catalog, tmp str, CAT CAT LEN - 1); 


Printf ("Enter title: "); 

(void)fgets(tmp str, TMP STRING LEN, stdin); 

strip return(tmp str); 

strncpy(new entry.title, tmp str, CAT TITLE LEN - 1); 


printf ("Enter type: *); 
(void)fgets(tmp str, TMP STRING LEN, stdin); 

strip return(tmp str); 

strncpy(new entry.type, tmp str, CAT TYPE LEN - 1); 


printf(*Enter artist: *); 
(void)fgets(tmp str, TMP STRING LEN, stdin); 

Strip return(tmp str); 

strncpy(new entry.artist, tmp str, CAT ARTIST LEN - 1); 





printf(*WNew catalog entry entry is :-Wn*); 

display cdc(&new, entry); 

if (get confirm(*Add this entry ?*)) ( 
memcpy(entry to update, &new entry, sizeof (new entry)); 


return(1); 


return(0); 


) 


(10) 下 面 是 用 于 输入 曲目 信息 的 函数 encer_new_rrack_entries。 这 个 函数 比 标题 项 函数 要 稍微 
复杂 一 点 ， 因 为 你 允许 保留 已 经 存在 的 曲目 项 : 
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static void enter new track entries(const cdc entry *entry to add to) 
€ 

Cdt entry new track, existing track; 

Char tmp str(TMP STRING LEN + 1]; 

int track no = 1; 

if (entry to add to-»catalog[0] == 'V0') return; 


printf(*inUpdating tracks for $sWn", entry to add to-»catalog); 
printf(*Press return to leave existing description unchanged, n*); 
printf(* a single d to delete this and remaining tracks, n'); 
printf(* or new track descriptionin*); 


while(1) ( 
(1) 首先 ， 必 须 检查 当前 曲目 编号 处 是 否 已 有 曲目 存在 。 根 据 查询 结果 ， 程 序 将 对 提示 做 相应 的 
修改 : 


memset(&new track, '\0', sizeof(new_track)); 
existing track = get_cdt_entry(entry_to_add_to->catalog, 
track no); 
if (existing track.catalog[0]) ( 
printf("\tTrack $d: $sYn*, track no, 
existing track.track txt); 
一 printf(*NXtNew text: *); 


else ( 
printf(*VXtTrack $d description: *, track no); 
) 
fgets(tmp str, TMP STRING LEN, stdin); 
Strip return(tmp str); 


(12) 如 果 当 前 曲目 编号 处 没有 现存 曲目 ， 而 且 用 户 也 未 添加 一 条 记录 ， 则 程序 就 认为 曲目 都 已 经 
添加 完毕 了 : 2 
if (strlen(tmp str) == 0) ( 


if (existing track.catalog[0] "o9 ( 
/* no existing entry, so finished adding */ 





break; 
} 
else { 
/* leave existing entry, jump to next track */ 
track noe; 
continue; 


} 
(13) 如 果 用 户 输入 一 个 单独 的 字符 4， 这 将 会 删除 当前 以 及 更 高 编号 的 曲目 记录 。 如 果 del_cat_ 
entry 函 数 找 不 到 待 删除 的 曲目 ， 它 将 会 返回 falses 


if ((strlen(tmp str) == 1) && tmp str[0] == 'd') ( 
/* delete this and remaining tracks */ 
while (del cdt entry(entry to add to-»catalog, track no)) ( 
track noe*; 





了 
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break; 
) 


(14) 下 面 这 段 代码 的 作用 是 添加 一 个 新 的 曲目 或 者 更 新 一 个 现 有 曲目 。 首 先 构建 一 个 cat_entry 
结构 new_track， 然 后 调用 数据 库 函 数 ada_cat_entry 来 把 它 添加 到 数据 库 中 : 


strncpy(new track.track txt, tmp str, TRACK TTEXT LEN - 1); 
strcpy(new track.catalog, entry to add to-»catalog); 
new track.track no - track no; 
if (add cdt entry(new track)) ( 
fprintf(stderr, "Failed to add new track\n"); 
break; 
) 
track no**; 
) /* while */ 


(15) 函数 del_cat_entry 删 除 一 个 标题 项 。 如 果 标题 项 被 删除 了 ， 那 么 原来 属于 它 的 曲目 记录 也 
都 将 被 删除 : 


static void del cat entry(const cdc entry *entry to delete) 
{ 

int track no = 1; 

int delete ok; 


display cdc (entry to delete); 
if (get confirm(*Delete this entry and all it's tracks? ")) ( 
do ( 
delete ok = del cdt entry(entry to delete-»catalog, 


track no); 
track now; 
) while(delete ok); 


if (!del cdc entry(entry to delete-»catalog)) ( 
fprintf(stderr, "Failed to delete entryin*); 
H 


) 
(16) 接 下 来 这 个 函数 的 作用 是 删除 与 某 个 标题 项 对 应 的 所 有 曲目 : 


atic void del track entries(const cdc entry *entry to delete) 





int track no = 1; 
int delete ok; 


display cdc (entry to delete); 
if (get confirm(*Delete tracks for this entry? *)) ( 
do ( 
delete ok = del cát entry(entry to delete-»catalog, track no); 
track noe; 
) while(delete ok); 
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(17) 下 面 是 一 个 非常 简单 的 标题 搜索 函数 。 它 允许 用 户 输入 一 个 字符 串 ， 然 后 查找 包含 这 个 字符 
串 的 标题 项 。 因 为 可 能 存在 多 个 匹配 的 记录 ， 所 以 只 是 依次 将 每 个 匹配 的 记录 提供 给 用 户 : 


static cdc entry find cat(void) 
t 





các entry item found; 

char tmp str[TMP STRING LEN + 1]; 
int first call - 1; 

int any entry found - 0; 

int string ol 
int entry selected - 0; 





do ( 
string ok = 1; 
printf(*Enter string to search for in catalog entry: "); 
fgets(tmp str, TMP STRING LEN, stdin); 
strip return(tmp str); 
if (strlen(tmp str) » CAT CAT LEN) ( 
fprintf(stderr, "Sorry, string too long, maximum %d V 
Characters Vn*, CAT CAT LEN); 
string.ok = 0; 
) 
) while (!string ok); 


while (lentry selected) ( 
item found = search cdc entry(tmp str, &first call]; 
if (item found.catalog[0] != '\0') ( 
any entry found = 1; 
printf(*W"); 
display cdc(&item found); 
if (get confirm("This entry? *)) ( 
entry selected = 1; 
} 
) 
else ( 
if (any entry found) printf(*Sorry, no more matches found\n"); 
else printf(*Sorry, nothing foundin*); 
break; 
} 
) 
return(item found); 





) 
(18) list_tracks 函 数 用 于 输出 指定 标题 项 的 所 有 曲目 : 


static void list tracks(const cdc entry *entry to use) 
t 

int track no - 1; 

cdt entry entry. found; 


display cdc(entry to use); 
printf(*WnTracksWn"); 
do € 





entry found = get cdt entry(entry to use-»catalog, 


track no); 
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if (entry found.catalog[0]) ( 
display. cdt (&entry. found); 
track no**; 
} 3 
) while(entry found.catalog[0]); 
(void)get confirm("Press return"); 
) /* list tracks */ 


(19) count_all_encries 函 数 用 于 统计 所 有 曲目 数量 : 


Static void count all entries(void) 
t 
int cd entries found - 0; 
int track entries found = 0; 
cdc, entry cdc. found; 
cdt entry cát. found; 
int track no = 1; 
int first time - 
char *search string = 








do ( 
các. found = search cdc entry(search string, &first time); 
if (cdc found.catalog[0]) ( 
cd entries founde«; 
track no = 
do ( 
cát found = get cdt entry(cdc found.catalog, track no); 
if (cát found.catalog[0]) ( 
track entries founde«; 
track no«*; 





) 
) while (cdt. found.catalog[0]); 
) 
) while (cdc, found.catalog[0]); 


printf('Found %d CDs, with a total of %d tracks Wn", cd entries found, 
track entries found); 
(void)get confirm(*Press return"); 


) 
(20) 下 面 是 aisplay_cdc 函 数 ， 它 用 来 显示 一 条 标题 项 记录 : 


static void display cdc(const cdc entry *cdc to show) 


printf('Catalog: %s\n", cdc to show-»catalog); 

printf("\ttitle: $sWn", cdc to show-»title); 

printf("\ttype: $sVn*, các to show-»type); 

printf('VXtartist: $sVn*, cdc to show-»artist); 
H 


display_cdt 函 数 的 作用 是 显示 一 条 曲目 项 记录 : 


static void display_cdt {const cát entry *cdt to show) 
t 
printf('td: $s Wn", cdt to show-»track no, cát to show-»track txt); 
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(21) strip_return 函 数 的 作用 是 删除 字符 串 尾部 的 换行 符 。 记 住 ，Linux 同 UNIX 一 样 ， 使 用 一 个 
单独 的 换行 符 来 表明 一 行 的 结束 : 
static void strip return(char *string to strip) 


t 


int len; 


len = strlen(string to strip| 


if (string to strip[len - 1] 'NXn') string to strip[len - 1] = '\0'; 





) 
(22) command_mode 是 一 个 对 命令 行 参 数 进行 解析 的 函数 。 其 中 调用 的 getopt 函 数 是 一 个 确保 程 
序 能 够 接受 符合 标准 Linux 规 范 的 参数 的 好 方法 : 


static int command mode(int argc, char *argv[]) 
t 

int c; 

int result = EXIT, SUCCESS; 

char *prog name = argv[0]; 


/* these externals used by getopt */ 
extern char *optarg; 
extern optind, opterr, optopt; 





while ((c = getopt(argc, argv, ":i*)) 53) 4 
switch(c) ( 
case 'i': 


if (!database initialize(1)) ( 
result - EXIT FAILURE; 
fprintf(stderr, "Failed to initialize databasein'); 





default: 
fprintf(stderr, "Usage: $s [-i] n*, prog name); 
result = EXIT FAILURE; 
break; 
) /* switch */ 
) /* while */ 
return(result); 








验 cd acce: 


现在 开始 介绍 用 于 访问 Gbm 数 据 库 的 函数 : 
(D 与 往常 一 样 ， 你 从 包含 头 文件 开始 。 然 后 用 #aefine 语 句 指定 将 用 来 存储 数据 的 文件 : 


#define  XOPEN, SOURCE 
finclude <unistd.h> 


finclude <stdlib.h> 
#include <stdio.h> 
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#include «fcntl.h» 
#include <string.h> 


#include «ndbm.h» 
/* The above may need to be changed to gdbm-ndbm.h on some distributions */ 


#include "cd data.h* 


$define CDC FILE BASE "các data" 
(define CDT FILE BASE *cdt data" 
define CDC FILE DIR "các data.dir* 
fdefine CDC FILE PAG "cdc data.pag"* 
Wdefine CDT FILE DIR "cát data.dir* 
#define CDT FILE PAG "cdt data.pag* 


(2) 使 用 下 面 两 个 文件 范围 变量 追踪 当前 的 数据 库 : 

static DBM *cdc dbm ptr = NULL; 

static DBM *cdt dbm ptr = NULL; 

(3) 默认 情况 下 , database_initialize 函 数 打开 一 个 已 有 的 数据 库 , 但 通过 传递 一 个 非 零 的 ( 即 
布尔 值 为 真 )》 参数 new_dacabase 给 它 ， 你 就 可 以 强迫 它 创建 一 个 新 的 〈 空 ) 数据 库 ， 并 有 效 地 删除 
任何 已 有 的 数据 库 。 如 果 数据 库 被 成 功 初始 化 ， 那 么 两 个 数据 库 指针 也 被 初始 化 ， 以 此 表明 数据 库 被 


HF: 


int database initialize(const int new database) 


{ 


Y 


int open mode = O CREAT | O_RDWR; 


/* If any existing database is open then close it */ 
if (cdc dbm ptr) dbm close(cdc dbm ptr); 
if (cdt dbm ptr) dbm close(cdt dbm ptr); 


if (new database) ( 
/* delete the old files */ 
(void) unlink(CDC FILE. PAG); 
(void) unlink(CDC FILE, DIR); 
(void) unlink(CDT FILE. PAG); 
(void) unlink(CDT FILE DIR); 
) 


/* Open some new files, creating them if required */ 
Cdc dbm ptr = dbm open(CDC FILE BASE, open mode, 0644); 
cdt dbm ptr - dbm open(CDT FILE BASE, open mode, 0644); 
if (!cdc dbm ptr || !cdt dbm ptr) ( 

fprintf(stderr, "Unable to create databasein*); 

Các dbm ptr = cdt dbm ptr = NULL; 

return (0); 
) 


return (1); 


(4) aatabase_close 函 数 用 于 关闭 已 打开 的 数据 库 ， 并 将 两 个 数据 库 指针 设 为 nu11， 以 此 表明 当 
前 没有 打开 的 数据 库 : 
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void database close(void) 

t 
if (cdc dbm ptr) dbm close(cdc dbm ptr); 
if (cdt dbm ptr) dbm close(cdt dbm ptr); 


Cdc dbm ptr = cdt dbm ptr = NULL; 
) 
(5) 接 下 来 这 个 函数 ， 当 给 它 传递 一 个 指向 标题 项 文本 字符 串 的 指针 时 ， 它 将 检索 出 一 个 标题 项 
米 。 如 果 标 题 项 没有 找到 ， 其 返回 数据 中 的 标题 域 将 为 空 : 


cdc_entry get cdc entry(const char *cd catalog ptr) 


Cdc entry entry to return; 

char entry to find[CAT CAT LEN + 1]; 
datum local data datum; 

datum local key datum; 


memset(&entry to return, '\0', sizeof(entry to return)); 


(6) 函数 先 做 一 些 完整 性 检查 ， 确 保 数据 库 已 打开 而 且 你 传递 了 一 个 合理 的 参数 ， 即 搜索 关键 字 
里 只 包含 有 效 的 字符 串 和 nul1: 
if (!cdc dbm ptr || !cdt_dbm_ptr) return (entry to return): 


if (!cd catalog ptr) return (entry to return); 
if (strlen(cd catalog ptr) »- CAT CAT LEN) return (entry to return); 


memset(&entry to find, '\0', sizeof(entry to find)); 
strcpy(entry to find, cd catalog ptr); 


(7) 设置 bm 函数 需要 的 Gatum 结 构 ， 然 后 使 用 dbm_fetch 函 数 来 检索 数据 。 如 果 没 有 数据 可 以 获 
得 ， 你 将 返回 先前 初始 化 过 的 空 的 entry_to_return 结 构 : 


local key datum.dptr = (void *) entry to find; 
local key datum.dsize - sizeof(entry to find); 


memset(&local data datum, 'V0', sizeof(local data datum)); 

local data datum - dbm fetch(cdc dbm ptr, local key datum); 

if (local data datum.dptr) ( 

memcpy(&entry to return, (char *)local data datum.dptr, m 





local data datum.dsize); 
) 
return (entry to return); 

) /* get.cdc entry */ 


(8) 你 希望 还 能 对 一 个 单独 的 曲目 项 进行 检索 ， 这 正 是 下 面 这 个 函数 实现 的 功能 。 它 与 get_cac_ 
entry 函 数 的 工作 方式 基本 类 似 ， 不 过 它 需 要 一 个 指向 标题 字符 串 的 指针 和 一 个 曲目 编号 作为 参数 

cdt entry get cdt entry(const char *cd catalog ptr, const int track no) 
t 

cát entry entry to return; 

char entry to find[CAT CAT LEN + 10]; 

datum local data datum; 

datum local key datum; 
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memset(&entry to réturn, '\0', sizeof(entry to return)); 


if (!cdc dbm ptr || !cdt dbm ptr) return (entry to return); 

if (!cd catalog ptr) return (entry to return); 

if (strlen(cd catalog ptr) »- CAT CAT LEN) return (entry to return); 

/* set up the search key, which is a composite key of catalog entry 
and track number */ 

memset(kentry to find, '\0', sizeof(entry to find]); 

sprintf(entry to find, "&s &d*, cd catalog ptr, track no]; 


local key datum.dptr = (void *) entry to find; 
local key datum.dsize = sizeot(entry to find): 


memset(&local data datum, 'X0', sizeof(local data datum)); 
local data datum = dbm fetch(cdt dbm ptr, local key datum); 
if (local data datum.dptr) ( 
memcpy(&entry to return, (char *) local data datum.dptr, 
local. data datum.dsize); 
} 
return (entry to return); 


(9) 下 一 个 函数 aaa_cac_entry 的 作用 是 增加 一 个 新 的 标题 项 记录 : 


int add cdc entry(const các entry entry_to_add) 





t 
char key to .add[CAT CAT LEN + 1]; 
datum local data datum; 
datum local key.datum; 
int result; 
/* Check database initialized and parameters valid */ 
if (!cdc.dbm ptr || !cát dbm ptr) return (0 
if (strlen(entry to add.catalog) >= CAT CAT LEN) return (0); 
/* ensure the search key contains only the valid string and nulls */ 
memset(&key to add, '\0', sizeof(key to add)); 
Strcpy(key to add, entry to adá.catalog); 
local key .datum.dptr = (void *) key to add; 
local key datum.dsize = sizeof(key to add); 
local data datum.dptr - (void *) &entry to add; 
local data datum.dsize - sizeof(entry to add); 
result = dbm store(cdc dbm ptr, local key datum, local. data datum, 
DBM REPLACE); 
/* dbm store() uses 0 for success */ 
if (result == 0) return (1); 
return (0); 
) 


(10) adG_cat_entry 函 数 的 作用 是 增加 一 个 新 的 曲目 项 记录 。 标 题字 符 串 和 曲目 编号 组 合 在 一 起 
构成 其 访问 关键 字 : 
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int add cdt entry(const cdt entry entry to add) 
{ 
char key to add[CAT CAT LEN + 10]; 
datum local data dat: 
datum local key datum; 
int result; 





if (!cdc dbm ptr || !cdt dbm ptr) return (0); 
if (strlen(entry to add.catalog) »- CAT CAT LEN) return (0); 


memset(&key to add, 'V0', sizeof(key to add)); 
sprintf(key to add, '$s td', entry to add.catalog, 
entry to add.track no); 


local key datum.dptr - (void *) key to add; 
local key datum.dsize - sizeof(key to add); 
local data datum.dptr = (void *) &entry. to add; 
local data datum.dsize = sizeof(entry to add); 


result - dbm store(cdt dbm ptr, local key datum, local data datum, 
DBM. REPLACE) ; 


/* dbm store() uses 0 for success and -ve numbers for errors */ 
if (result 0) 

return (1); 
return (0); 





) 
(11) 既然 可 以 往 数 据 库 里 增加 数据 ， 你 最 好 还 能 删除 它们 。 下 面 这 个 函数 的 作 
记录 : 


int del cdc entry(const char *cd catalog ptr) 
t 





就 是 删除 标题 项 


char key to del[CAT CAT LEN + 1]; 
datum local key datum; 
int result; 


if (!cdc dbm ptr || !cádt dbm ptr) return (0); 
if (strlen(cd catalog ptr) >= CAT CAT LEN) return (0); 


memset(&key to del, 'X0', sizeof(key to del)); 
strcpy(key to del, cd catalog ptr); 





local key datum.dptr - (void *) key to del; 
local key datum.dsize = sizeof(key to del); 


result = dbm delete(cdc dbm ptr, local key datum); 
/* dbm delete() uses 0 for success */ 


if (result -- 0) return (1); 
return (0); 





H 
(12) 与 上 面 的 函数 类 似 ， 这 个 函数 用 于 删除 曲目 记录 。 记 住 ， 曲 目 关键 字 是 由 
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目 编号 两 者 构成 的 一 个 复合 索引 : 
int del cdt entry(const char *cd catalog ptr, const int track no) 
t 
Char key-to del[CAT CAT LEN + 10]; 
datum local key datum; 
int result; 


if (!cdc dbm ptr || !cát dbm ptr) return (0); 
if (strlen(cd catalog ptr) »- CAT CAT LEN) return (0); 


memset(&key to del, '\0', sizeof(key to del)); 
sprintf(key to del, "$s d", cd catalog ptr, track no); 


local key.datum.dptr = (void *) key to del; 
local key datum.dsize = sizeof(key to del); 


result = dbm delete(cdt dbm ptr, local key datum); 


/* dbm delete() uses 0 for success */ 
if (result == 0) return (1); 
return (0); 
) 
(13) 最 后 非常 重要 的 一 点 是 ， 你 还 有 一 个 简单 的 搜索 函数 。 它 不 是 非常 复杂 ， 但 它 演示 了 如 何在 
预先 不 知道 关键 字 的 情况 下 扫描 全 部 的 abm 记 录 项 。 
因为 你 事先 并 不 知道 会 有 多 少 匹 配 的 记录 项 ， 所 以 你 将 这 个 函数 实现 为 每 次 调用 返回 一 个 记录 
项 。 如 果 什 么 也 没 找 到 ， 记 录 项 就 将 是 空 的 。 为 了 扫描 整个 数据 库 ， 你 在 调用 这 个 函数 时 使 用 一 个 指 
向 整数 的 指针 *first_call_prt， 函数 第 一 次 被 调用 时 应 被 设置 为 1， 然 后 这 个 函数 就 知道 它 应 
该 在 数据 库 的 起 始 处 开始 搜索 。 在 后 续 的 调用 中 ， 这 个 变量 将 被 设置 为 0， 函 数 将 会 从 上 次 找到 记录 
项 的 位 置 开始 继续 搜索 。 
当 希 望 重新 开始 搜索 时 , 比如 要 搜索 另外 一 个 标题 项 时 , 你 必须 把 *first_call_ptr 的 值 设 为 真 ， 
次 调用 这 个 函数 ， 这 将 重新 初始 化 搜索 。 
个 函数 的 两 次 调用 之 间 ， 函 数 维护 一 些 内 部 状态 信息 。 这 样 做 的 目的 是 向 客户 隐藏 继续 搜索 
的 复杂 性 ， 同 时 保留 了 搜索 函数 在 具体 实现 方面 的 秘密 。 
如 果 搜 索 文本 指针 指向 nul1 字 符 ， 那 么 所 有 的 记录 项 都 将 被 认为 是 匹配 的 。 
cdc entry search_cdc_entry(const char *cd catalog ptr, int *first call ptr] 
t 












static int local first call = 1; 

Các entry entry to return; 

datum local data datum; 

Static datum local key datum; /* notice this must be static */ 


memset(&entry to return, '\0', sizeof(entry to return]]; 
(14) 和 往常 一 样 ， 先 做 完整 性 检查 : 


if (!cdc dbm ptr || !cdt_dbm ptr) return (entry to return); 
if (!cd catalog ptr || !first call ptr) return (entry to return); 
if (strlen(cd catalog ptr) »- CAT CAT LEN) return (entry to return); 
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/* protect against never passing *first call ptr true */ 
if (local first call) ( 
local first call 
*first call ptr 





) 
(13) 如 果 这 个 函数 被 调用 时 ，*first_cal1_ptz 被 设置 为 crue， 就 表示 你 需要 从 数据 库 的 起 始 位 
置 开始 搜索 《或 重新 开始 搜索 )。 如 果 *Eirst_call_ptz 的 值 不 是 crue， 你 只 需 移动 到 数据 库 中 的 下 
一 个 关键 字 : 


if (*first call ptr) ( 
*first call ptr = 
local key datum = 





dbm firstkey(cdc dbm ptr); 
) 
else ( 

local key datum = dbm nextkey(cdc dbm ptr); 


do ( 
if (local key datum.dptr != NULL) ( 
/* an entry was found */ 
local data datum = dbm fetch(cdc dbm ptr, local key datum); 
if (local data datum.dptr) ( 
memcpy(&entry to return, (char *) local data datum.dptr, 
local data datum.dsize); 


(16) 搜索 方式 非常 简单 ， 它 只 是 检查 当前 标题 项 是 否 包 含 搜索 字符 串 : 


/* check if search string occurs in the entry */ 
if (!strstr(entry to return.catalog, cd_catalog_ptr)) 
t 
memset(&entry to return, '\0', 
sizeof (entry to return)); 
local key datum = dbm nextkey(cdc dbm ptr); 


) 


2 
) while (local key datum.dptr && 
local data datum.dptr && 


(entry-to return.catalog[0] == '\0')); T. 
return (entry to return); 
) /* search cdc entry */ 
现在 你 将 通过 下 面 的 nakefile 文 件 把 所 有 的 程序 结合 在 一 起 。 现在 还 无 须 太 过 操心 它 ， 因 为 你 马 
上 就 要 在 下 一 章 中 了 解 ? 作 原 理 。 目 前 你 只 需 圳 入 它 的 内 容 并 将 其 保存 为 Makefile 文 件 即 可 : 


all: application 








INCLUDE-/usr/include/gdbm 


LIBS=gdbm 
# On some distributions you may need to change the above line to include 


# the compatability library, as shown below. 
# LIBS= -lgdbm compat -lgdbm 
CFLAGS= 
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app.ui.o: app ui.c cd data.h 
gcc $(CFLAGS) -c app ui.c 


access.o: access.c cd data.h 
gcc $(CFLAGS) -I$(INCLUDE) -c access.c 


application: app.ui.o access.o 
gcc $(CFLAGS) -o application app ui.o access.o -1$(LIBS) 


clean: 
rm -f application *.o 


nodbmfiles: 

rm -f *.dir *.pag 
要 想 编译 这 个 新 的 CD 唱片 应 用 程序 ， 你 需要 在 提示 符 后 输入 下 面 的 命令 : 
$ make 


如 果 一 切 顺利 ， 可 执行 文件 application 将 被 编译 并 放置 到 当前 目录 中 。 
75 小 结 


在 本 章 中 ， 你 学 习 了 数据 管理 的 3 个 方面 知识 。 首 先 ， 你 学 习 了 Linux 内 存 系统 的 知识 ， 虽 然 按 需 
换 页 虚拟 内 存 的 内 部 实现 非常 复杂 ， 但 它 的 使 用 还 是 相当 简单 的 。 你 还 学 习 了 它 是 如 何 保护 操作 系统 
和 其 他 进程 免 受 非法 内 存 访问 侵害 的 。 

接 下 来 ， 我 们 介绍 了 文件 锁定 功能 是 如 何 允 许多 个 程序 在 访问 数据 时 协调 工作 的 。 你 首先 看 到 了 
一 个 简单 的 二 进 制 信号 量 机 制 。 然 后 是 一 个 更 复杂 的 情形 ， 即 用 共享 锁 和 独占 锁 来 锁 住 同一 个 文件 的 
不 同 部 分 。 然 后 我 们 介绍 了 abm 库 ， 它 具有 使 用 一 个 非常 灵活 的 索引 布局 来 存储 和 高 效 地 检索 任意 数 
据 块 的 能 力 。 

最 后 ， 我 们 用 abm 库 作为 数据 存储 技术 重新 设计 并 实现 了 CD 唱片 应 用 程序 。 
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此 ， 我 们 已 经 探讨 了 使 用 平面 文件 进行 一 些 基 本 的 数据 管理 ， 随 后 又 介绍 了 简单 但 却 非常 
快速 的 sbm。 现 在 我 们 将 介绍 一 个 功能 更 齐全 的 数据 工具 : RDBMS 或 关系 型 数据 库 管理 系 
统 (Relational Database Management System). 
两 个 最 著名 的 开源 RDBMS 应 用 软件 是 PostgreSQL 和 MySQL。PostgreSQL 能 在 任何 情况 下 免费 使 
用 。MySQL 尽 管 在 某 些 环境 下 需要 收取 许可 证 费用 ,但 在 许多 场合 下 它 还 是 免费 的 。 用 于 同一 用 途 的 
商业 产品 有 Oracle、Sybase 和 DB2， 它 们 都 能 运行 于 多 种 平台 之 上 。 仅 支持 Windows 平 台 的 微软 SQL 
Server 是 市 场 上 的 另 一 个 分 支 。 所 有 这 些 产品 包 都 有 它们 独特 的 优点 ， 但 由 于 本 书 的 容量 限制 以 及 宣 
传 开源 软件 的 义务 ， 本 书 将 只 专注 于 MySQL。 
MySQL 的 起 源 大 约 要 追溯 到 1984 年 ， 但 在 MySQL AB 公 司 的 赞助 之 下 ，MySQL 用 于 商业 开发 和 
已 经 有 许多 年 了 。 虽然 MySQL 是 开源 的 , 但 它 的 使 用 条 款 经 常 与 其 他 的 开源 项 目 发 生 混淆 。 因此， 
里 指出 ， 虽 然 它 在 许多 场合 下 的 使 用 是 遵循 GPL 的 ， 但 是 也 有 许多 场合 下 你 必须 购买 
它 的 商业 许可 证 才能 使 用 它 。 
如 果 你 需要 一 个 开源 数据 库 , 但 是 又 无 法 接受 在 GPL 之 下 使 用 MySQL 的 条 款 ， 并且 你 不 希望 购 类 
它 的 商业 许可 证 ， 那 么 在 写作 本 书 的 时 候 ， 因 为 使 用 PostgreSQL 的 许可 证 条 款 不 存在 那么 多 限制 ， 你 
或 许可 以 考虑 使 用 具备 更 强 功能 的 PostgreSQL 数 据 库 。 有 关 PostgreSQL 的 更 多 详细 资料 见 网 址 
www.postgresql.org « 
要 了 解 更 多 有 关 PostgreSQL 的 内 容 ， 请 查阅 我 们 的 书籍 (PostgreSQL: 从 入 门 到 专家 》 
Beginning Databases with PostgreSQL: From Novice to Professional) 第 二 版 ( Apress, 2005, 
ISBN 1590594789 ). 
在 本 章 中 ， 我 们 将 介绍 下 面 一 些 MySQL 主 题 : 
口 安装 MySQL 
O 必 备 的 MySQL 管 理 命令 
口 MySQL 的 基本 功能 
O 从 C 程 序 访问 MySQL 数 据 库 的 API 
O 使 用 C 语 言 创建 一 个 用 于 我 们 的 CD 数据 库 应 用 程序 的 关系 型 数据 库 


8.1 安装 


无 论 你 喜欢 使 用 的 是 哪 种 Linux 套 件 , 你 的 Linux 套 件 很 可 能 已 提供 了 预 编译 的 MySQL 版 本 进行 安 
装 。 例 如 ，Red Hat、SUSE 和 Ubuntu 都 在 它们 的 当前 发 行 版 中 提供 了 预 编译 的 MySQL 软 件 包 。 一 般 来 
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说 ， 我 们 建议 读者 使 用 预 编译 的 版 本 ， 因 为 它 提供 了 一 种 最 简单 的 快速 建立 并 运行 MySQL 的 方法 。 如 
果 你 的 发 行 版 未 提供 MySQL 软 件 包 ， 或 者 你 想 使 用 最 新 的 MySQL 版 本 ， 那 么 你 可 以 从 MySQL 的 网 站 
上 下 载 二 进 制 包 和 源 代码 包 。 

在 本 章 中 ， 我 们 只 介绍 如 何 安装 预 编译 的 MySQL 版 本 。 


8.1.1 MySQL 软件 包 


如 果 你 因 故 需要 下 载 MySQL 而 不 是 使 用 与 Linux 套 件 捆绑 的 版 本 ， 对 本 书 而 言 ， 你 应 该 使 用 
MySQL 社 区 版 中 的 标准 软件 包 。 你 会 看 到 还 有 Max 和 Debug 软 件 包 可 以 使 用 。 其 中 Max 软 件 包 包含 
些 额外 的 功能 ， 如 支持 更 多 不 常见 的 存储 文件 类 型 和 一 些 高 级 功能 如 集群 )。Debug 软 件 包 在 被 编 
译 时 包含 了 一 些 额外 调试 代码 和 信息 ， 希 望 你 不 需要 使 用 这 么 底层 的 调试 。 

不 要 在 正规 场合 使 用 Debug 版 本 ， 因 为 额外 的 调试 支持 会 降低 软件 的 性 能 . 

为 了 开发 MySQL 应 用 程序 ， 你 不 仅 需要 安装 MySQL 服 务 器 ， 还 需要 安装 MySQL 开 发 库 。 通 常情 
况 下 ， 软 件 包 管理 器 都 会 有 一 个 MySQL 选 项 ， 你 只 需要 确认 开发 库 已 被 选择 安装 。 在 图 8-1 中 ， 你 可 
以 看 到 Fedora 的 软件 包 管理 器 选择 了 额外 的 开发 软件 包 以 安装 MySQL。 
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图 8-1 


在 其 他 Linux 发 行 版 中 ， 软 件 包 的 安排 可 能 略 有 不 同 。 例 如 ， 图 8-2 显 示 了 Ubuntu 的 synaptic 软 件 包 
管理 器 选择 MySQL 软 件 包 的 界面 。 
MySQL 在 安装 时 还 会 创建 用 户 “mysql”， 该 用 户 是 MySQL 服 务 器 守护 进程 运行 时 所 使 用 的 默认 
用 户 名 。 
安装 完 MySQL 软 件 包 之 后 ， 你 需要 检查 MySQL 是 否 已 自动 启动 了 。 在 写作 本 书 的 时 候 ， 有 些 
Linux 发 行 版 如 Ubuntu 是 这 么 做 的 ， 但 也 有 一 些 Linux 发 行 版 如 Fedora 没 有 这 么 做 。 幸 运 的 是 ， 检 查 
MySQL 服 务 器 是 否 正在 运行 是 一 件 非常 容易 的 事情 : 


$ ps -el | grep mysqld 
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16 packages imed. «i neralad o briken. 10 to etaliupgrade. ro remove: wi Md he uted 
图 8-2 
如 果 你 看 到 有 一 个 或 多 个 mysqld 进 程 正 i， 那 么 表示 MySQL 服 务 器 已 启动 了 。 在 许多 Linux 
系统 中 ， 你 还 会 看 到 存在 一 个 safe_mysq1a 进 程 ， 它 是 一 个 以 正确 的 用 户 id 启动 真正 的 mysala 进 程 的 


工具 。 
如 果 需 要 启动 〈 或 重启 、 停 止 ) MySQL 服 务 器 ， 你 可 以 使 用 GUI 界面 的 服务 控制 面板 。Fedora 的 


服务 配置 面板 如 图 8-3 所 示 。 























图 8-3 
你 还 可 以 使 用 服务 配置 编辑 器 ， 米 确定 你 是 否 想 要 MySQL 服 务 器 在 每 次 Linux 启 动 时 自动 运行 。 
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8.1.2 安装 后 的 配置 
假设 一 切 运行 正常 , 现在 MySQL 已 经 安装 完成 并 以 默认 选项 集 启动 了 。 下 面 让 我 们 来 测试 这 一 假 
设 是 否 正确 : 
$ mysql -u root mysql 
如 果 看 到 “Welcome to the MySQL monitor” 信 息 和 一 个 mysql> 提 示 符 ， 就 表示 服务 器 正在 运行 
了 。 当 然 ， 现 在 任何 人 都 能 连接 到 服务 器 并 拥有 管理 员 权 限 ， 我 们 将 在 稍 后 解决 这 个 问题 。 试 着 输入 
\s 来 得 到 更 多 关于 服务 器 的 信息 。 看 完 后 ， 输 入 auic 或 者 \q 退 出 控制 台 。 
使 用 命令 mysql -? 可 以 获得 更 多 有 关 服务 器 的 信息 。 在 该 命令 的 输出 中 ， 有 一 条 重要 信息 值得 注 
意 。 在 该 命令 输出 参数 列表 之 后 , 你 通常 将 看 到 类 似 Default options are read from the following 
files in the given order: 这 样 的 一 句 话 。 它 告诉 你 在 哪里 可 以 找到 配置 文件 ， 如 果 需 要 配置 Mysor 
服务 器 ， 你 就 需要 用 到 该 文件 。 配 置 文件 通常 是 /etc/my .cnf， 也 有 一 些 发 行 版 (如 Ubuntu) 使 用 的 
是 /etc/mysql/my.cnf。 
你 也 可 以 使 用 mysqladmin 命 令 来 查看 正在 运行 的 服务 器 状态 : 
$ mysqladmin -u root version 
这 个 命令 的 输出 不 仅 将 确认 服务 器 是 否 正在 运行 ， 而 且 还 将 告知 正在 使 用 的 服务 器 的 版 本 
mysqladmin 命 令 还 可 以 借助 使 用 variables 选 项 检查 一 个 正在 运行 的 服务 器 中 的 所 有 配置 
$ mysqladmin variables 
上 面 的 命令 将 输出 一 长 串 变量 设置 。 其 中 两 个 特别 有 用 的 变量 是 : datadirfllhave innodb, Wf 
者 告诉 你 MySQL 在 哪里 存储 它 的 数据 ， 后 者 的 值 通常 是 YEs， 表 明 MySQL 服 务 器 支持 InnoDB 存 储 引 
擎 。MySQL 支 持 好 几 种 存储 引擎 ， 即 用 于 数据 存储 的 底层 实现 程序 。 最 常见 〈 也 是 最 有 用 ) 的 两 个 存 
储 引擎 是 InnoDB 和 MyISAM， 但 也 有 一 些 其 他 的 存储 引擎 ， 如 memory 引 擎 ， 它 根本 不 使 用 永久 存储 ， 
而 CSV 引 擎 则 使 用 逗号 分 隔 的 变量 文件 。 不 同 的 引擎 有 着 不 同 的 功能 和 性 能 。 对 于 通用 数据 库 来 说 ， 
我 们 目前 建议 使 用 InnoDB 存 储 引擎 , 因为 它 在 性 能 和 对 加 强 不 同 数据 元 素 之 间 关系 的 支持 上 取得 了 一 
个 很 好 的 折 中 。 如 果 服 务 器 没有 启用 对 InnoDB 的 支持 , 请 检查 配置 文件 /etc/my .cnf, fEskip-innodb 
- 行 的 开头 加 上 # 号 以 注释 掉 该 行 ， 然 后 使 用 服务 编辑 器 重启 MySQL。 如 果 这 样 做 不 行 ， 那 么 你 使 用 
的 MySQL 版 本 可 能 在 编译 时 没有 包含 InnoDB 的 支持 。 如 果 这 对 你 很 重要 ， 那 么 请 检查 MySQL 网 站 以 
找到 一 个 支持 InnoDB 的 版 本 。 对 于 本 章 来 说 ， 即 使 你 使 用 的 是 MyISAM 存 储 引擎 也 没有 关系 ， 许 多 发 
行 版 默认 使 用 的 就 是 这 个 引擎 。 
- 旦 知道 服务 器 二 进 制 代码 中 已 包括 了 对 InnoDB 的 支持 ,为 了 将 其 设置 为 默认 存储 引擎 ， 你 必须 
按 如 下 方法 修改 /etc/my .cnt 文 件 ， 否 则 服务 器 默认 使 用 的 就 是 MyISAM 引 擎 。 修 改 方法 非常 简单 ， 
在 /etcymy .cnf 文 件 的 mysqla 一 节 中 添加 aefault-storage-engine=INNODB 一 行内 容 。 如 下 所 示 文 
件 的 开头 : 
[mysqld] 


default-storage-engine=INNOD 
datadir=/var/lib/mysql 




















在 本 章 的 剩余 部 分 ， 我 们 假设 默认 的 存储 引擎 已 被 设置 为 InnoDB。 
在 实际 的 应 用 环境 中 ， 你 通常 还 会 想 改变 由 GataGir 变 量 设置 的 默认 存储 位 置 。 这 也 是 通过 编辑 
/etc/my .cnf 配 置 文件 中 的 mysqld 一 节 来 完成 的 例如 ,如 果 你 使 用 的 是 InnoDB 存 储 引擎 ,准备 将 数 
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据 文件 放 在 /vol102 目 录 中 ,将 日 志文 件 放 在 /vo103 目 录 中 ,设置 数据 文件 的 初始 大 小 为 0OM， 并 允许 
它 自 扩充 ， 你 可 以 使 用 如 下 的 配置 行 : 

innodb_data_home_dir = /vol02/mysql/data 

innodb data file path = ibdatal:10M:autoextend 

innodb log.group home dir = /vol03/mysql/logs 


你 可 以 在 www.mysql.com 网 站 上 的 在 线 手册 中 了 解 更 多 信息 。 

如 果 服 务 器 不 能 启动 或 服务 器 启动 后 你 无 法 连接 到 数据 库 , 请 阅读 下 一 节 来 诊断 安装 中 

的 问题 . 

好 的 ， 还 记得 之 前 我 们 提 到 的 那个 巨大 的 安全 漏洞 吗 ? 它 允 许 任何 人 以 root 用 户 身 份 进行 连接 而 
不 需要 输入 密码 。 现 在 是 时 候 提高 服务 器 的 安全 性 了 。 你 不 要 被 MySQL 安 装 中 所 使 用 的 root 用 户 
名 搞 糊 涂 了 ，MySQL 的 root 用 户 和 系统 的 root 用 户 毫 无 关系 。MySQL 只 不 过 默认 使 用 一 个 称 为 “root” 
的 用 户 作为 管理 用 户 , 就 像 Linux 操 作 系 统一 样 ,。 MySQL 数 据 库 的 用 户 和 Linux 系 统 的 用 户 ID 没 有 关系 ， 
MySQL 有 它 自 己 的 内 置 用 户 和 权限 管理 。 在 默认 情况 下 ， 只 要 在 Linux 系 统 中 有 账号 的 用 户 都 可 以 以 
MySQL 管 理 员 的 身份 登录 进 MySQL 服 务 器 。 一 旦 你 收 紧 了 MySQL 中 root 用 户 的 权限 ， 如 只 允许 本 地 
用 户 以 root 用 户 身份 登录 并 设置 了 访问 密码 ， 你 就 可 以 只 添加 对 你 的 应 用 程序 正常 工作 绝对 必要 的 用 
户 和 权限 了 。 

有 很 多 设 定 root 用 户 密码 的 方法 ， 最 简单 的 方法 是 使 用 如 下 命令 ， 

$ mysqladmin -u root password newpassword 

这 将 设 定 初始 密码 为 newpasswora。 

但 是 ， 这 个 方法 会 引发 问题 ， 因 为 明文 密码 将 会 留 在 shell 的 历史 记录 中 ,并且 当 命令 正在 执行 时 ， 
其 他 人 可 以 使 用 ps 命令 看 到 该 密码 ， 或 者 通过 你 的 命令 历史 记录 重 现 该 密码 。 一 个 更 好 的 方法 是 再 次 
使 用 MySQL 控 制 台 ， 这 次 是 发 送 一 些 SQL 语句 来 修改 你 的 密码 。 

$ mysql -u root 


Welcome to the MySQL monitor. Commands end with ; or Mg. 
Your MySQL connection id is 4 









Type 'help;' or '\h' for help. Type '\c' to clear the buffer. 

mysql» SET passwordsPASSWORD|'secretpassword'); 

Query OK, 0 rows affected (0.00 sec) 

当然 ， 你 需要 选择 一 个 只 有 你 自己 知道 的 密码 ， 而 不 是 例子 中 的 “secretpassword”， 这 个 密码 只 
是 用 来 显示 你 自己 的 密码 应 该 输入 的 位 置 。 如 果 你 又 想 要 删除 这 个 密码 ， 你 只 需 用 一 个 空 字 符 申 代替 
“secretpassword” 即 可 。 

请 注意 ， 我 们 使 用 一 个 分 号 ( ; ) 来 结束 SQL 命令 .严格 来 说 ， 分 号 并 不 是 实际 SQL 命令 

的 一 部 分 ， 它 只 是 告诉 MySQL 客 户 端 程序 我 们 的 SQL 语句 已 准备 好 被 执行 了 。 我 们 还 为 SQL 

关键 字 使 用 了 大 写字 母 ， 如 SET。 这 并 不 是 必需 的 ， 因 为 实际 的 MySQL 语 法 允许 关键 字 使 用 

大 写 或 小 写字 母 ， 但 我 们 在 本 书 中 以 及 在 日 常 的 工作 中 都 习惯 于 使 用 大 写 的 关键 字 ， 因 为 这 

样 会 使 得 SQL 语 句 更 容易 阅读 . 


现在 检查 一 下 权限 表 以 确认 密码 已 被 设置 。 首 先 使 用 use 命 令 切 换 到 mysql 数 据 库 ， 然 后 查询 内 部 
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mysql> use mysql 

mysql» SELECT user, ho: 
| user | host | password | 
| root | localhost | 2dxf8e9c23age6ed | 
| root | fc7blpáe | | 
| | localhost | 


password FROM user; 














4 rows in set (0.01 sec) 


mysql» 

注意 观察 ， 我 们 为 从 localhost 建 立 连接 的 root 用 户 创建 了 一 个 密码 。MySQL 不 仅 能 为 用 户 保存 
不 同 的 权限 ， 也 能 为 基于 主机 名 的 连接 类 保存 不 同 的 特权 。 确 保安 装 安全 的 下 一 步 将 是 去 除 那 些 由 
MySQL 默 认 安装 的 不 需要 的 用 户 。 下 面 的 命令 将 会 从 权限 表 中 删除 所 有 非 root 用 户 : 

mysql» DELETE FROM user WHERE user != 'root'; 

Query OK, 2 rows affected (0.01 sec) 

下 一 条 命令 将 删除 从 localhost 以 外 的 任何 主机 的 登录 : 

mysql» DELETE FROM user WHERE host != 'localhost'; 

Query OK, 1 row affected (0.01 sec) 

最 后 ， 使 用 如 下 命令 来 检查 是 可 还 有 遗漏 的 登录 : 


mysql> SELECT user, host, password FROM user; 
| user | host 









1 row in set 





nysql»exit 

从 上 面 的 输出 可 以 看 出 ， 我 们 现在 只 有 一 个 仅 能 从 localhost 连 接 的 登录 。 

现在 是 验证 事实 的 时 刻 了 : 我 们 仍 能 使 用 设 定 的 密码 来 登录 吗 ? 注意 ， 这 次 我 们 给 出 -p 参 数 ， 它 
要 求 MySQL 必 须 给 出 询问 密码 的 提示 : 

$ mysql -u root -p 

Enter password: 

Welcome to the MySQL monitor. Commands end with ; or \g. 

Your MySQL connection id is 7 





Type 'help;' or 'Ah' for help. Type '\c' to clear the buffer. 


mysql» 

现在 ， 我 们 有 了 一 个 正在 运行 的 MySQL 版 本 ， 它 已 经 被 限制 为 只 有 使 用 我 们 设 定 密码 的 root 用 户 
才能 连接 到 数据 库 服务 器 ， 并 且 这 个 root 用 户 只 能 从 本 地 机 器 连接 。 我 们 还 可 以 在 命令 行 上 提供 密码 
以 连接 到 MySQL。 你 可 以 使 用 参数 --password， 如 --password=secretpassword， 或 使 用 
-psecretpassword， 但 显然 这 是 不 太 安全 的 ， 因 为 密码 可 能 被 ps 命令 或 通过 命令 历史 记录 看 到 。 
然而 ， 如 果 你 正在 编写 一 个 需要 连接 到 MySQL 的 脚本 ， 那 么 在 命令 行 上 提供 密码 又 是 必要 的 。 
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下 一 步 是 添加 需要 的 用 户 。 对 于 Linux 系 统 来 说 ， 除 非 绝 对 必需 ， 否 则 最 好 使 用 root 账 号 来 登录 
MySQL， 所 以 你 应 该 为 日 常 使 用 创建 一 个 普通 用 户 。 

正如 我 们 之 前 提示 的 ， 你 可 以 针对 不 同 的 机 器 来 创建 用 户 ， 并 给 他 们 分 配 不 同 的 连接 权限 。 特 别 
地 ， 出 于 安全 考虑 ， 我 们 只 允许 root 用 户 通过 本 地 机 器 连接 。 在 本 章 中 ， 我 们 将 创建 一 个 拥有 相当 广 
泛 权限 的 新 用 户 rick。ricx 将 能 使 用 3 种 不 同 的 方法 进行 连接 。 

口 从 本 地 机 器 连接 。 

口 从 IP 地 址 在 192.168.0.0 一 192.168.0.255 范 围 内 的 任何 机 器 连接 。 

O 从 wiley .com 域 中 的 任何 机 器 连接 。 

最 安全 最 简单 的 方法 是 创建 3 个 不 同 的 用 户 ， 他 们 分 别 从 3 个 不 同 的 地 点 进行 连接 。 如 果 愿 意 ， 我 
们 甚至 可 以 根据 他 们 从 何 处 连接 给 他 们 分 别 设置 3 个 不 同 的 密码 。 

我 们 通过 使 用 grant 命 令 来 创建 用 户 并 赋予 权限 。 这里, 我 们 使 用 上 面 列 出 的 3 个 不 同 的 连接 起 点 
来 创建 用 户 。IDENTIFIED BY 是 一 个 有 点 古怪 的 设 定 初始 密码 的 语法 。 请 注意 引号 的 使 用 方法 ， 如 下 
面 显示 的 那样 正确 使 用 单 引号 是 很 重要 的 ， 否 则 我 们 将 不 能 按照 我 们 期 望 的 那样 创建 用 户 。 

以 root 用 户 身份 连接 到 MySQL， 然 后 依次 执行 如 下 操作 。 

(1) 为 rick 创 建 一 个 本 地 登录 : 


mysql> GRANT ALL ON *.* TO rick@localhost IDENTIFIED BY 'secretpassword'; 
Query OK, 0 rows affected (0.03 sec) 


(2) 然后 创建 一 个 来 自 C 类 子 网 192.168.0 的 登录 。 注 意 ， 我 们 必须 用 单 引号 来 保护 1P 范 围 ， 并 使 用 
掩 码 /255 .255.255.0 来 确定 允许 的 IP 地 址 范围 : 

mysql> GRANT ALL ON *.* TO rick@'192.168.0.0/255.255.255.0' IDENTIFIED BY 

'secretpassword'; 

Query OK, 0 rows affected (0.00 sec) 

(3) 最 后 ， 创 建 一 个 登录 ， 让 rick 能 从 wi Ley .com 域 中 的 任何 机 器 登录 同样 也 需要 注意 单 引 号 
的 使 用 ): 

mysql> GRANT ALL ON *.* TO rick@'%.wiley.com' IDENTIFIED BY 'secretpassword'; 

Query OK, 0 rows affected (0.00 sec) 

(4) 现在 我 们 再 次 查看 user 表 来 核对 条 目 : 


mysql> SELECT user, host, password FROM mysql.user; 





| user | host | password | 
| root | localhost | 2dxf8e8cl7ade6ea | 
| rick | localhost | 3742g6348q8378d9 | 
| rick | $.wiley.com | 3742g6348q8378d9 | 
| | 








mysql> 

当然 ， 你 需要 调整 上 面 的 命令 和 密码 来 适应 你 的 本 地 配置 。 你 将 注意 到 , 我 们 使 用 的 是 GRANT ALL 
ON *.* 命 令 ， 正 如 你 可 能 猜测 的 那样 ， 这 给 了 用 户 ricx 非 常 广 泛 的 权限 。 对 于 权力 很 大 的 用 户 这 样 
做 当然 很 好 ,但 是 对 于 创建 受 限 用 户 就 不 适用 了 。 我 们 将 在 本 章 的 8.2.2 节 中 更 详细 地 介绍 grant 命 令 。 
在 那里 ， 我 们 将 讲解 如 何 创建 一 个 受 限 用 户 。 
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至 此 我 们 已 经 安装 并 运行 了 MySQL (如 果 还 没有 ， 请 阅读 下 一 节 )， 提 高 了 服务 器 的 安全 性 ， 并 
且 创 建 了 一 个 非 root 用 户 来 准备 完成 一 些 工 作 。 接 下 来 我 们 将 首先 讨论 安装 后 的 故障 修复 ， 然 后 回 过 
头 来 快速 地 浏览 一 下 MySQL 数 据 库 管理 的 要 素 。 


8.1.3 安装 后 的 故障 修复 


如 果 使 用 mysql 进行 连接 失败 ， 你 可 以 使 用 系统 的 ps 命令 来 检查 服务 器 进程 是 否 正在 运行 。 如 果 
不 能 在 ps 命令 的 输出 列表 中 找到 它 ， 则 可 以 尝试 执行 命令 mysqal_safed-1og. 它 会 将 一 些 额外 信息 写 
入 位 于 MySQL 日 志 目录 中 的 文件 。 还 可 以 尝试 直接 启动 mysala 进 程 ， 也 可 以 使 用 命令 mysala- -ver- 
bose--help 以 获得 完整 的 命令 行 选项 列表 。 

也 有 可 能 是 服务 器 正在 运行 ， 但 却 拒绝 了 你 的 连接 。 如 果 是 这 样 ， 下 一 个 需要 检查 的 就 是 数据 库 
是 否 存在 ， 特 别 是 默认 的 MySQL 权 限 数据 库 是 否 存在 。Red Hat 发 行 版 通常 默认 使 用 的 数据 库 目录 是 
/var/1ib/mysql， 但 其 他 发 行 版 可 能 使 用 不 同 的 目录 位 置 。 请 检查 MySQL 的 启动 脚本 〔 例 如 ， 
/etc/init.G 目 录 中 ) 和 配置 文件 /etc/my.cnf 来 找到 数据 库 目 录 位 置 ， 你 也 可 以 使 用 myaala 
-verbose -help 命 令 直接 调用 mysqld 程 序 ， 并 查找 命令 输出 中 的 变量 aataair 来 找到 数据 库 目录 位 
x. - 且 你 找到 了 数据 库 目录 ， 请 确认 它 至 少 包含 一 个 默认 的 权限 数据 库 〈 称 为 mysal)， 并 且 服务 器 
:在 使 用 这 个 位 置 《通过 文件 my .cnf 来 指定 )。 

法 连接 ， 请 使 用 服务 编辑 器 停止 服务 器 ， 检 查 并 确认 已 没有 mysala 进 程 正 在 运 和 

试 连接 。 如 果 这 样 做 你 还 是 无 法 连接 ， 你 可 以 尝试 完全 外 载 MySQL 并 重 
它 。MySQL 网 站 上 的 MySQL 文 档 也 是 非常 有 用 的 资源 是 比 本 地 的 手册 页 要 新 ， 而 且 

包含 一 些 用 户 编辑 的 提示 和 建议 以 及 一 个 论坛 ), 你 可 以 通常 浏览 该 文档 来 找到 一 些 更 深层 次 的 人 
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包含 在 MySQL 发 行 版 中 的 一 些 有 用 的 工具 程序 使 管理 工作 变 得 相当 容易 。 它 们 中 最 常用 的 是 
mysqladmin 程 序 。 我 们 将 在 本 节 中 介绍 这 个 程序 以 及 其 他 一 些 工 具 。 
































8.2.1 命令 
除 mysqlshow 命 令 以 外 ， 所 有 的 MySQL 命 令 都 接受 表 8-1 所 示 的 3 个 标准 参数 。 
表 8-1 
命令 选项 5 mm 说 明 
-u 用 户 名 在 默认 情况 下 , mysql 工 具 会 尝试 把 当前 Linux 的 用 户 名 作为 MySQL 的 用 户 名 .你 
可 以 使 用 -u 参 数 来 指定 一 个 不 同 的 用 户 名 
EJ [密码 ] 如果 给 出 了 -p 参 数 但 是 未 提供 密码 , 系统 会 提示 输入 密码 , 如 果 没有 给 出 -p 参 数 ， 
MySQL 命 令 将 假设 不 需要 密码 
-h 主机 名 用 于 连接 位 于 不 同 主机 上 的 服务 器 〈 这 个 参数 对 于 本 地 服务 器 总 是 可 以 省 略 ) 








我 们 再 次 建议 你 不 要 把 密码 放 在 命令 行 上 ， 因 为 它 可 以 被 Ds 命令 看 到 。 











1. myisamchk 命 令 

myisamchk 工 具 是 设计 用 来 检查 和 修复 使 用 默认 MYISAM 表 格式 的 任何 数据 表 ,MY1 
式 由 MySQL 自 身 支持 。 通常 情况 下 ，myisamchk 应 该 以 安装 时 创建 的 mysal 用 户 身份 来 
运行 该 命令 时 应 该 位 于 数据 表 所 处 的 目录 中 。 为 了 检查 数据 库 ， 首 先 执行 命令 su mysql, 然后 改 
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变 目 录 到 与 数据 库 名 称 对 应 的 目录 下 ， 使 用 表 8-2 中 推荐 的 一 个 或 多 个 选项 来 运行 myisamchk。 例 
dn: 


myisamchk -e -r *.MYI 


myisamchk 最 常见 的 命令 选项 见 表 8-2。 











* 82 
命令 选项 $m m 
Ed 检查 表 以 发 现 错误 
e 执行 扩展 检查 
a 修复 发 现 的 错误 





为 获得 更 多 信息 ， 我 们 可 以 不 带 任何 参数 的 调用 myisamchk 命 令 以 查看 更 多 的 帮助 信息 。 这 个 工 
有 具 对 InnoDB 类 型 的 数据 表 没 有 效果 。 

2. mysql 命 令 

这 是 MySQL 一 个 主要 的 且 功 能 非常 强大 的 命令 行 工 具 。 儿 乎 每 个 管理 或 用 户 级 别 的 任务 都 可 以 在 
这 里 执行 。 你 可 以 从 命令 行 启动 mysql， 通 过 在 命令 行 的 最 后 添加 数据 库 名 称 作为 参数 ， 你 就 无 需 在 
MySQL 的 控制 台中 使 用 use <database> 命 令 。 例 如 ， 以 用 户 名 rick、 提 示 输 入 密码 (注意 -p 参 数 后 
面 有 一 个 空格 )、 默 认 使 用 数据 库 foo 来 启动 控制 台 的 命令 如 下 所 示 : 

$ mysql -u rick -p foo 

你 可 以 使 用 mysql -help | 1 

如 果 在 启动 MySQL 时 未 指 
个 数据 库 ， 正 如 表 8-3 的 命令 列表 显 

另外 ， 你 还 可 以 通过 非 交互 模式 ， 只 需 捆绑 命令 到 一 个 输入 文件 中 并 从 命令 行 读 取 
它 即 可 。 在 这 种 情况 下 命令 行 上 指定 密码 : 

$ mysql -u rick -~ sword: 'retpassword foo < sqlcommands.sql 

旦 mysq1 读 取 并 处 理 完 命令 ， 将 返回 到 命令 提示 符 。 

当 mysql 客 户 端 连接 到 服务 器 后 ， 除 了 标准 的 SQL92 命 令 集 以 外 ， 还 有 一 些 特定 的 命令 也 会 被 

mysql 支 持 ， 如 表 8-3 所 示 。 






















表 8-3 

*$ $9 可 选 的 简短 形式 说 明 
helpik ? \h 或 \? 显示 命令 列表 
edit \e 编辑 命令 。 使 用 的 编辑 器 由 环境 变量 SEDITOR 决 定 
exit È quit E 退出 MySQL 客 户 端 
go Ns 执行 命令 
source <filename> Ne 从 指定 文件 执行 SQL 
status \s 显示 服务 器 状态 信息 
System «command» M 执行 一 个 系统 命令 
tee «filename v 把 所 有 输出 的 副本 添加 到 指定 文件 中 
use «database» wu 使 用 给 定 的 数据 库 





这 个 命令 集中 一 个 非常 重要 的 命令 是 use。rmwsala 服 务 器 支持 同时 拥有 许多 不 同 的 数据 库 这 一 想 
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法 ， 所 有 的 数据 库 都 由 同一 个 服务 器 进程 来 服务 和 管理 。 许 多 其 他 数据 库 服务 器 ， 如 Oracle 和 Sybase， 
使 用 术语 schema (HR) ， 而 MySQL 最 经 常 使 用 的 术语 是 database 《MySQL 查询 浏览 器 使 用 的 是 术语 
schema) 。 每 个 数据 库 〈 在 MySQL 的 术语 中 ) 都 是 一 个 基本 独立 的 表格 集 。 这 使 得 你 可 以 针对 不 同 的 
目的 建立 不 同 的 数据 库 ， 并 为 每 个 数据 库 指定 不 同 的 用 户 ， 而 只 需要 使 用 同一 个 数据 库 服务 器 就 可 以 
有 效 地 管理 它们 了 。 只 要 拥有 适当 的 权限 ， 你 就 可 以 通过 使 用 use 命令 在 不 同 的 数据 库 之 间 进行 切 换 。 

特定 数据 库 mysql 是 由 MySQL 安 装 自动 创建 的 ， 它 用 于 保存 如 用 户 和 权限 这 样 的 数据 。 

SQL92 是 使 用 最 广泛 的 一 个 ANSISQL 标 准 版 本 . 它 为 SQL 数 据 库 的 工作 方式 、 不 同 数据 
库 产品 之 间 的 互 操作 和 通信 创建 一 致 的 标准 . 

















3. mysqladmin 
这 是 快速 进行 MySQL 数 据 库 管理 的 主要 工具 .除了 常见 的 参数 以 外 , 它 还 支持 如 表 8-4 所 示 的 命令 。 
表 84 
* 令 说 m 
Create «database name» 创建 一 个 新 数据 库 
drop <database_name> 删除 一 个 数据 库 
password «new password» 修改 密码 〈 正 如 你 前 面 看 到 的 那样 ) 
ping 检查 服务 器 是 否 正在 运行 
reload 重 载 控制 权限 的 granr 表 
status 提供 服务 器 的 状态 
Shutdown 停止 服务 器 
variables 显示 控制 MySQL 操 作 的 变量 及 其 当前 值 
version 提供 服务 器 的 版 本 号 以 及 它 持续 运行 的 时 间 


如 果 不 带 参数 调用 mysqladmin 命 令 ， 我 们 就 可 以 从 命令 提示 符 下 看 到 完整 的 选项 列表 。 你 也 许 
想 使 用 | less 来 分 页 显示 。 





将 不 会 有 机 会 使 用 这 个 命令 .顾名思义 ,这 个 工具 生成 一 个 用 于 发 送 给 MySQL 
维护 者 的 错误 报告 ,在 发 送 它 之 前 , 你 可 能 希望 编辑 生成 的 文件 以 提供 对 开发 者 可 能 有 用 的 其 他 信息 。 
5. mysqldump 
这 是 一 个 极其 有 用 的 工具 ， 它 允许 你 以 SQL 命 令 集 的 形式 将 部 分 或 整个 数据 库 导 出 到 一 个 单独 文 
件 中 ， 该 文件 能 被 重新 导入 MySQL 或 其 他 的 SQL RDBMS。 它 接受 标准 用 户 和 密码 信息 作为 参数 ， 也 
接受 数据 库 名 和 表 名 作为 参数 。 表 8-5 中 列 出 的 其 他 选项 大 大 扩展 了 这 个 工具 的 功能 。 








表 8-5 
命令 xo m 
--add-drop-table 添加 SQL 命 令 到 输出 文件 ， 以 在 创建 表 的 命令 之 前 丢弃 《删除 ) 任何 表 
ES 使 用 扩展 的 insert 语 法 。 这 不 是 标准 SQL， 但 是 如 果 正 在 转 储 大 量 数据 ， 那 么 当 你 试 
图 重新 加 载 这 些 数据 到 MySQL 时 ， 这 将 加 快 转 储 数据 的 加 载 速度 
t 只 转 储 表 中 的 数据 ， 而 不 是 用 来 创建 表 的 信息 
-d 只 转 储 表 结构 ， 而 不 是 实际 数据 


默认 情况 下 ，mysqldump 将 数据 发 送 到 标准 输出 ， 而 你 一 般 都 是 希望 把 它 重 定向 到 文件 。 
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这 个 工具 对 于 迁移 数据 或 快速 备份 非常 有 用 。 此 外 ， 由 于 MySQL 的 客户 端 服务 器 实现 方式 ， 通 过 
使 用 一 个 安装 在 不 同 机 器 上 的 mysqldump 客 户 端 ， 它 甚至 可 以 用 来 实现 远程 备份 。 下 面 这 个 例子 显示 
了 通过 用 户 名 rick 进 行 连接 ， 转 储 数据 库 myplayab 的 例子 : 

$ mysqldump -u rick -p myplaydb > myplaydb.dump 

在 我 们 的 系统 上 ， myplaydb 数 据 库 中 只 有 一 个 表 ， 结 果 文 件 如 下 所 示 : 

-- MySQL dump 10.11 





-- Host: localhost Database: myplaydb 





Server version 5.0.37 


/[*140101 SET GOLD CHARACTER SET CLIENT-GGCHARACTER SET CLIENT */; 
/*140101 SET GOLD CHARACTER SET RESULTS-G6CHARACTER SET RESULTS */; 
/*140101 SET GOLD COLLATION CONNECTION-GGCOLLATION, CONNECTION */; 
/*!40101 SET NAMES utf8 * 








ie SET @OLD_TIME_ZONE=@@TIME_ZONE */; 
1 SET TIME_ZONE='+00:00' */; 
/* SET GOLD UNIQUE CHECKS-GGUNIQUE CHECKS, UNIQUE CHECKS-0 */; 





# SET @OLD_FOREIGN_KEY_CHECKS=@@FOREIGN_KEY_CHECKS, FOREIGN_KEY_CHECKS=0 */; 
/*!140101 SET @OLD_SQL_MODE=@@SQL_MODE, SQL MODE-'NO. AUTO VALUE ON ZERO' */; 
/*140111 SET GOLD SQL NOTES-GGSQL NOTES, SQL NOTESs0 */; 





Table structure for table 'children' 





DROP TABLE IF EXISTS 'children'; 
CREATE TABLE 'children' ( 
'childno' int(11) NOT NULL auto increment, 
'fname' varchar(30) default NULL, 
'age' int(11) default NULL, 
PRIMARY KEY ('chilóno') 
) ENGINE-InnoDB DEFAULT CHARSET-latinl; 


-- Dumping data for table 'children' 


LOCK TABLES 'children' WRITE; 

/*140000 ALTER TABLE 'children' DISABLE KEYS */; 

INSERT INTO 'children' VALUES 

(1, 'Jenny',21), (2, 'Andrew' ,17) , (3, 'Gavin', 8), (4, 'Duncan' ,6) , (5, 'Emma' , 4) , 
(6, 'Alex',15), (7, 'Adrian',9); 

/*!40000 ALTER TABLE 'children' ENABLE KEYS */; 

UNLOCK TABLES; 

/*140103 SET TIME ZONE-GOLD TIME ZONE */; 


/*!40101 SET SQL MODE- GOLD SQL MODE */; 

/*140014 SET FOREIGN KEY CHECKS-&OLD FOREIGN KEY CHECKS */; 
/*140014 SET UNIQUE CHECKS-6OLD UNIQUE CHECKS */; 

/*140101 SET CHARACTER SET CLIENT-GOLD CHARACTER SET CLIENT */; 
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/*140101 SET CHARACTER SET RESULTS-GOLD CHARACTER SET RESULTS */; 
/*140101 SET COLLATION CONNECTION-80LD COLLATION CONNECTION */; 
/*140111 SET SQL NOTES-60LD SQL NOTES */; 


-- Dump completed on 2007-06-22 20:11:48 

6. mysqlimport 

mysqlimport 命 令 用 于 批量 将 数据 导入 到 一 个 表 中 。 通 过 使 用 mysqlimport， 你 可 以 从 一 个 输入 
文件 中 读 取 大 量 的 文本 数据 。 这 个 命令 唯一 的 参数 需求 是 一 个 文件 名 和 一 个 数据 库 名 。 mysqlimport 
将 把 数据 导入 到 数据 库 中 与 文件 名 (不 包括 任何 文件 扩展 名 ) 相同 的 表 中 。 你 必须 确认 文本 文件 与 将 
要 填 入 数据 的 表 拥有 相同 的 列 数 ， 并 且 数据 类 型 是 兼容 的 。 在 默认 情况 下 ， 数 据 应 以 tab 分 隔 符 分 开 。 

正如 我 们 前 面 提 到 的 那样 ， 我 们 也 可 以 通过 一 个 文本 文件 来 执行 SQL 命 令 ， 只 需 运 行 mysql 命 令 ， 
并 将 输入 重 定向 到 一 个 文件 即 可 。 

7. mysqlshow 

这 个 小 工具 能 够 让 你 快速 了 解 MySQL 安 装 及 其 组 成 数据 库 的 信息 。 

口 不 提供 参数 ， 它 列 出 所 有 可 用 的 数据 库 。 

O 以 一 个 数据 库 为 参数 ， 它 列 出 该 数据 库 中 的 表 。 

口 以 数据 库 和 表 名 为 参数 ， 它 列 出 表 中 的 列 。 

口 以 数据 库 、 表 和 列 为 参数 ， 它 列 出 指定 列 的 详细 
8.22 ”创建 用 户 并 赋予 权限 

作为 MysQL 管 理 员 ， 最 常见 的 工作 就 是 维护 用 户 信息 一 一 在 MySQL 中 添加 和 删除 用 户 并 管理 他 
们 的 权限 。 从 MySQL 3.22 开 始 ， 我 们 可 以 通过 在 MySQL 控 制 台 中 使 用 granc 和 revoke 命 令 来 管理 用 
户 权限 一 一 与 在 以 前 版 本 中 必须 通过 直接 编辑 特权 表 来 管理 用 户 相 比 ， 这 项 任务 变 得 轻松 了 很 多 。 

1. grant 命 令 

MySQL 的 grant 命 令 几 乎 完全 遵循 3QL92 的 语法 ， 尽 管 不 是 非常 严格 。 它 的 常规 格式 是 : 


grant «privilege» on «object» to «user» [identified by user-password] [with 
grant option]; 


可 以 授予 的 特权 值 如 表 8-6 所 示 。 


ig. 














表 86 

r1 说 了 明 
alter 改变 表 和 索引 
create 创建 数据 库 和 表 
delete 从 数据 库 中 删除 数据 
drop 删除 数据 库 和 表 
index 管理 索引 
insert 在 数据 库 中 添加 数据 
lock tables 允许 锁定 表 
select 提取 数据 
update 修改 数据 
all 以 上 所 有 





一 些 命令 还 有 其 他 选项 。 例 如 ，create view 授 予 用 户 创建 视图 的 权限 。 要 想 了 解 最 权威 的 权限 
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列表 ， 请 查阅 MySQL 版 本 的 文档 ， 因 为 每 一 个 新 的 MySQL 版 本 都 会 对 这 一 领域 进行 扩展 。 还 有 一 些 
特殊 的 管理 权限 ， 但 我 们 在 这 里 并 不 关注 它们 。 

授予 特权 的 对 象 被 标识 为 : 

databasename.tablename 
在 Linux 传 统 中 ，* 代 表 的 是 通配符 ， 因 此 * .* 代 表 每 个 数据 库 中 的 每 个 对 象 ， 而 foo.* 代 表 数据 库 foo 
中 的 每 个 表 。 

如 果 指定 的 用 户 已 经 存在 ， 他 的 特权 会 被 编辑 以 反映 你 所 做 的 修改 。 如 果 该 用 户 不 存在 ， 他 就 会 
以 指定 的 特权 被 创建 。 正 如 你 前 面 看 到 的 那样 ， 用 户 可 以 被 指定 为 来 自 某 个 特定 的 主机 。 你 应 该 在 同 
一 个 命令 中 同时 指定 用 户 和 主机 ， 以 便 灵 活 获得 MySQL 权 限 配置 。 

在 SQL 语法 中 ， 特 殊 字 符 % 代 表 通 配 符 ， 它 与 shell 环 境 中 * 号 的 作用 完全 一 样 。 你 当然 可 以 为 每 个 
期 望 的 特权 使 用 单独 的 命令 ,但 是 如 果 你 想 授予 用 户 rick 从 wiley .com 域 中 任何 主机 访问 的 权限 ， 可 
以 把 rick 描 述 为 : 

rick&"^6.wiley.com* 

任何 时 候 使 用 % 通 配 符 都 必须 把 它 放 在 引号 中 ， 以 与 其 他 文本 分 开 。 

你 还 可 以 使 用 IP/ 网 络 掩 码 标识 〔N.N.N.N/M.M.M.M) 来 为 访问 控制 设置 一 个 网 络 地 址 。 

正如 我 们 之 前 使 用 ricke'192.168.0.0/255.255.255.0' 来 授予 rick 从 本 地 网 络 中 任何 机 器 连 
接 的 特权 那样 ， 我 们 也 可 以 指定 ricke'192.168.0.1' 来 将 rick 的 访问 限制 到 一 台 工作 站 ， 或 指定 
rick8'192.0.0.0/255.0.0.0' 来 扩大 范围 以 包括 192 这 个 A 类 网 络 中 的 所 有 机 器 。 

下 面 是 另外 一 个 例子 : 

mysql> GRANT ALL ON foo.* TO rick@'%' IDENTIFIED BY 'bar'; 

这 将 创建 用 户 rick， 他 拥有 对 数据 库 soc 的 所 有 权限 ， 并 能 以 初始 密码 bar 从 任何 机 器 进行 连接 。 

如 果 数 据 库 foo 尚 未 存在 ， 那 么 用 户 rick 现 在 将 拥有 使 用 SQL 命令 create Gatabase 来 创建 该 数 
据 库 的 权限 。 

IDENTIFIED BY 子 句 是 可 选 的 ， 但 在 创建 用 户 的 同时 最 好 确保 他 们 都 设置 有 密码 。 

你 需要 格外 小 心 在 用 户 名 、 主 机 名 或 数据 库 名 中 包含 下 划 线 的 情况 ， 因 为 SQL 中 的 下 划 线 是 一 种 
匹配 任意 单个 字符 的 模式 ， 这 与 $ 匹 配 一 个 字符 串 非常 类 似 。 因 此 只 要 有 可 能 ， 请 尽量 不 要 在 用 户 名 
和 数据 库 名 中 包含 下 划 线 。 

- 般 来 说 ，wich grant option 只 会 用 于 创建 二 级 管理 员 。 但 是 ， 它 也 可 以 用 于 允许 一 个 新 创建 
的 用 户 将 授予 他 的 特权 赠 予 其 他 用 户 。 所 以 请 始终 谨慎 地 使 用 with grant option. 

2. revoke 命 令 

当然 , 管理 员 不 仅 可 以 授予 用 户 权限 ,同样 也 能 够 剥夺 用 户 权限 。 这 是 通过 revoke 命 令 来 完成 的 : 

revoke «a privilege» on «an object» from «a user» 

这 与 grant 命 令 的 格式 极其 相似 。 例 如 ， 

mysql» REVOKE INSERT ON foo.* FROM rick@'%'; 

但 是 ，revoke 命 令 不 能 删除 用 户 。 如果 想 要 完全 删除 一 个 用 户 ， 不 要 只 是 修改 他 们 的 权限 ， 而 应 
用 revoke 来 删除 他 们 的 权限 。 然 后 ， 你 就 可 以 切换 到 内 部 的 mysql 数 据 库 ， 通 过 从 user 表 中 删除 相应 
的 行 来 完全 删除 一 个 用 户 : 

mysql> use mysql 


mysql> DELETE FROM user WHERE user = "rick" 
mysql> FLUSH PRIVILEGES; 
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因为 未 指定 主机 ， 所 以 我 们 就 可 以 确保 删除 了 我 们 想 要 删除 的 MySQL 用 户 ( 在 本 例 中 是 rick》 
的 每 个 实例 。 在 完成 了 这 个 之 后 , 请 一 定 要 返回 你 自己 的 数据 库 ( 使 用 use 命 令 ), 否则 你 仍然 在 MySQL 
自己 的 内 部 数据 库 中 。 
请 理解 delete 与 grant 和 revoke 并 不 属于 同一 范畴 .由 于 MySQL 处 理 权 限 方式 的 需要 ， 
这 里 的 SQL 语法 是 必需 的 。 你 是 通过 直接 更 新 MySQL 的 权限 表 ( 因此 首先 调用 命令 use 
mysql) 来 有 效 地 完成 修改 的 - 
在 更 新 表 之 后 ， 你 必须 使 用 命令 FLUSH PRIVILEGES 来 告诉 MySQL 服 务 器 ， 它 需要 重 载 
它 的 权限 表 ， 正 如 上 面 例子 中 显示 的 那样- 


8.23 密码 


如 果 想 为 尚未 拥有 密码 的 用 户 指定 密码 ， 或 者 希望 改变 自己 或 别人 的 密码 ， 你 就 需要 以 root 用 户 
身份 连接 到 MySQL 服 务 器 ， 然 后 直接 更 新 用 户 信息 。 例 如 : 


mysql> use mysql 
mysql> SELECT host, user, password FROM user; 


你 会 得 到 如 下 的 一 个 列 








| host | user | password | 
ee a EE " 


| localhost | root | 67457e226alalSbd | 
| localhost | foo | | 


2 rows in set (0.00 sec) 
如 果 想 给 用 户 foo 指 定 密码 par， 则 可 以 这 样 做 : 
mysql> UPDATE user SET password = password('bar') WHERE user = 'foo'; 


再 次 显示 user 表 中 的 相关 列 ; 


mysql> SELECT host, user, password FROM user; 








| localhost | root | 65457e236glalwbq | 
| localhost | foo | 7c9e0a41222752fa | 
[rura WEE CEU re + 
2 rows in set (0.00 sec) 

mysql> 


很 显然 ， 用 户 foo 现 在 有 一 个 密码 了 。 请 不 要 忘记 返回 你 原先 的 数据 库 。 
从 MySQL 4.1 开 始 ， 密 码 机 制 已 经 被 更 新 过 了 。 但 是 ， 考 虑 到 向 后 兼容 性 ， 你 仍然 可 以 使 用 函数 
OLD PASSWORD “要 设置 的 密码 ') 来 通过 老 的 算法 设 定 密码 。 


824 创建 数据 库 


下 一 步 工作 就 是 创建 数据 库 。 假设 你 想 要 一 个 名 为 rick 的 数据 库 ， 还 记得 你 已 用 同样 的 名 字 创建 
了 一 个 用 户 。 首 先 ， 需 要 授予 用 户 ricx 广 泛 的 权限 以 允许 他 创建 新 的 数据 库 。 这 样 做 对 一 个 开发 系统 
尤其 有 用 ， 因 为 它 可 以 让 用 户 有 更 大 的 灵活 性 。 
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mysql> GRANT ALL ON *.* TO rickélocalhost IDENTIFIED BY 'secretpassword'; 


现在 以 rick 用 户 身份 登录 并 创建 数据 库 来 测试 权限 设置 : 
$ mysql -u rick -p 
Enter password: 


mysql» CREATE DATABASE rick; 
Query OK, 1 row affected (0.01 sec) 
mysql> 


告诉 MySQL 我 们 想 使 用 新 的 数据 库 ; 

mysql» use rick 

现在 ， 你 可 以 向 数据 库 中 添加 你 想 要 的 表 和 信息 了 。 在 以 后 的 登录 中 ， 你 可 以 在 命令 行 的 结尾 指 
定数 据 库 ， 而 不 需要 再 使 用 use 命 令 了 : 

$ mysql -u rick -p rick 

在 按照 提示 输入 密码 之 后 ， 作 为 连接 过 程 的 一 部 分 ， 在 默认 情况 下 ， 你 将 自动 切换 到 使 用 数据 库 
rick. 
8.25 数据 类 型 

现在 ， 你 有 了 一 个 可 以 运行 的 MySQL 服 务 器 、 一 个 安全 的 用 户 登 录 和 一 个 准备 好 使 用 的 数据 库 。 
接 下 来 需要 做 什么 呢 ? 你 需要 创建 一 些 包含 列 的 表 来 保存 数据 。 但 是 ， 在 此 之 前 ， 你 需要 了 解 MySQL 
支持 的 数据 类 型 。 

MySQL 的 数据 类 型 非常 标准 , 因此 在 这 里 我 们 将 仅仅 简要 地 浏览 主要 的 类 型 。 一 如 往常 , MySQL 
网 站 上 的 MySQL 和 手册 对 此 进行 了 更 为 详细 的 讨论 。 

1. 布尔 类 型 

可 以 用 关键 字 BOoL 来 定义 布尔 列 。 正 如 你 所 期 望 的 那样 ， 它 将 持 有 TRUE 和 FALSE 值 。 它 也 可 以 持 
有 特殊 的 数据 库 “ 未 知 ” 值 NULL。 

2. 字符 类 型 

如 表 8-7 所 示 ， 有 多 种 字符 类 型 可 供 选择 。 前 3 个 是 标准 的 ， 后 3 个 是 MySQL 特 有 的 。 我 们 建议 在 
满足 实际 使 用 要 求 的 前 提 下 ， 尽 量 坚持 使 用 标准 类 型 。 








表 8-7 
* x ww om 
CHAR 单字 符 
CHAR (N) 正好 及 个 字符 的 字符 串 ， 如 果 必 要 会 以 空格 字符 填充 。 限 制 为 255 个 字符 
VARCHAR(N) AN 个 字符 的 可 变 长 数组 。 限 制 为 255 个 字符 
TINYTEXT 类 似 于 VARCHAR(N) 
MEDIUMTEXT 最 长 为 65 5335 个 字符 的 文本 字符 让 
LONGTEXT 最 长 为 29-1 个 字符 的 文本 字符 串 
3. 数值 类 型 


数值 类 型 分 为 整 型 和 浮 点 型 ， 如 表 8-8 所 示 。 
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R 88 
æ x 类 型 说 m 
TINYINT 整 型 8 位 数据 类 型 
SMALLINT 整 型 16 位 数据 类 型 
BEDIUMINT 整 型 24 位 数据 类 型 
INT 整 型 32 位 数据 类 型 。 这 是 标准 类 型 ， 对 于 一 般 使 用 是 很 好 的 选择 
BIGINT 整 型 64 位 有 符号 数据 类 型 
FLOAT (P) 浮 点 型 精度 至 少 为 p 位 数字 的 浮 点 数 
DOUBLE (D, N) 浮 点 型 有 符号 双 精度 浮 点 数 ， 有 pD 位 数字 和 位 小 数 
NUMERIC(P, S) 浮 点 型 总 长 为 P 位 的 真实 数字 ， 小 数 点 后 有 s 位 数字 。 与 poUBLE 不 同 ， 这 是 一 个 准 
确 的 数 ， 因 此 适合 用 来 储存 货币 值 ， 但 处 理 效率 会 低 一 点 
DECIMAL (P, S) 浮 点 型 与 NUMERIC 同 义 





一 般 情 况 下 ， 我 们 建议 你 坚持 使 用 TNP、poUBLE 和 NUMERIC 类 型 ， 因 为 它们 最 接近 于 标准 的 SQL 
类 型 。 其 他 类 型 是 非 标准 的 ， 如 果 你 将 来 需要 移动 数据 ， 其 他 数据 库 系统 中 可 能 不 支持 这 些 类 型 。 





4. 时 间 类 型 
有 5 种 时 间 数 据 类 型 可 供 使 用 ， 如 表 8-9 所 示 。 
表 8-9 

— € LAE e e e 

Em x i m 

DATE 存储 从 1000 年 1 月 1 日 ~9999 年 12 月 31 日 之 间 的 日 期 

TIME 存储 从 -838:59:59~838:59:59 之 间 的 时 间 

TIMESTAMP 存储 从 1970 年 1 月 1 日 -2037 年 之 问 的 时 间 怕 

DATETIME 存储 从 1000 年 1 月 1 日 -9999 年 12 月 31 日 最 后 一 秒 之 间 的 日 期 

YEAR 存储 年 份 。 注 意 两 位 数 的 年 份 值 ， 因 为 它 不 明确 ， 将 被 自动 转换 为 四 位 数 的 年 份 


请 注意 ， 当 比较 DATE 和 DATETIME 值 以 了 解 时 间 部 分 是 如 何 处 理 的 时 候 ， 你 需要 格外 小 心 ， 你 
可 能 会 看 到 非 期 望 的 结果 。 详 细 信息 请 查阅 MySQL 的 手册 ， 因 为 不 同 版 本 的 MySQL 其 行为 稍 有 不 同 。 


8.2.6 创建 表 


至 此 ， 你 已 运行 了 数据 库 服务 器 ， 了 解 了 如 何 分 配 用 户 权限 以 及 如 何 创建 数据 库 和 一 些 基 本 的 数 
据 库 类 型 ， 现 在 你 可 以 开始 创建 表 了 。 

一 个 数据 库 表 只 不 过 是 一 系列 的 行 ， 而 每 行 又 由 固定 数目 的 列 组 成 。 它 非常 像 电子 表格 ， 除 了 每 
行 都 必须 包含 相同 数目 和 类 型 的 列 ， 而 且 每 行 必 须 以 某 种 方式 不 同 于 表 中 的 其 他 行 。 

只 要 合乎 情理 ， 一 个 数据 库 可 以 包含 的 表格 数 是 不 受 限制 的 。 但 是 ， 很 少 有 数据 库 需要 100 个 以 
上 的 表 ， 对 于 大 多 数 小 系统 来 说 ，25 个 左右 的 表 通 常 就 足够 了 。 

创建 数据 库 对 象 的 完整 SQL 语法 被 称 为 DDL (data definition language， 数 据 定义 语言 )。 它 相当 复 
杂 , 要 想 在 一 章 的 内 容 中 全 面 介绍 该 语法 是 很 困难 的 , 关于 它 的 详细 内 容 可 以 在 MySQL 网 站 的 文档 区 
找到 。 

创建 表 的 基本 语法 是 : 


CREATE TABLE «table name» ( 
Column type [NULL | NOT NULL] [AUTO INCREMENT] [PRIMARY KEY] 
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Bay 
[, PRIMARY KEY ( column [, ... ] ) ] 

) 

你 可 以 用 DROP TABLE 语 法 来 删除 表 ， 这 非常 简单 : 


DROP TABLE <table_name> 


就 目前 而 言 ， 你 仅 需要 了 解 少数 几 个 关键 字 就 可 以 完成 表 的 快速 创建 了 ， 这 几 个 关键 字 如 表 8-10 


表 8-10 
关键 字 说 上 明 

AUTO INCREMENT 这 一 特殊 的 关键 字 告 诉 MySQL， 无 论 何 时 ， 当 你 在 该 列 中 写 入 NULL 值 时 ， 它 都 会 自 
动 把 一 个 自动 分 配 的 递增 数字 填 入 列 数据 中 。 这 是 一 个 非常 有 用 的 特征 ， 它 可 以 通过 
MySQL 来 自动 为 表 中 的 行 分 配 一 个 唯一 的 数字 , 尽管 它 只 能 用 于 属于 主键 的 列 。 在 其 他 
数据 库 中 ， 这 一 功能 通常 由 一 个 serial 类 型 提供 ， 或 由 一 个 序列 值 来 明确 管理 

NULL -个 特殊 的 数据 库 值 ， 它 通常 用 来 表示 “未 知 的 ”， 但 也 能 用 来 表示 “无 关 的 ”。 例 
如 ， 如 果 你 正在 将 雇员 详细 信息 填 入 表 中 ， 可 能 有 一 列 代表 个 人 电子 邮件 地 址 ， 但 是 可 
能 一 些 雇员 没有 个 人 电子 邮件 地 址 。 在 这 种 情况 下 ， 你 应 该 将 雇员 的 电子 邮件 地 址 保存 
为 NULL 以 表示 此 信息 跟 特定 的 人 无 关 。 语 法 Nor NuLL 意 味 着 这 行 不 能 存储 NuLL 值 ， 这 
对 阻止 某 些 列 持 有 NoLL 值 是 很 有 用 的 ， 例 如 ， 有 些 值 如 雇员 的 姓氏 必须 要 知道 

PRIMARY KEY 指出 此 列 的 数据 必须 是 唯一 的 ， 该 表 每 行 中 对 应 该 列 的 值 都 应 不 同 。 每 个 表 只 能 有 
个 主键 

















ww 创建 表 并 添加 数据 


观看 实践 中 表 的 创建 要 比 学 习 基本 语法 简单 得 多 ， 所 以 现在 让 我 们 来 创建 一 个 名 为 children 的 
表 。 它 将 为 每 个 孩子 存储 一 个 唯一 的 数字 、 名 和 年 龄 。 我 们 把 孩子 的 编号 作为 主 
(1) 你 需要 的 SQL 命令 是 : 
CREATE TABLE children ( 
Chiláno INTEGER AUTO INCREMENT NOT NULL PRIMARY KEY, 
fname VARCHAR(30), 
age INTEGER 





à 


注意 ， 与 大 多 数 程序 设计 语言 不 同 ， 列 名 (childno) 出 现在 列 数据 类 型 ( INTEGER) 
zd. 


(2) 你 还 可 以 使 用 另外 一 种 语法 将 列 定义 和 主键 定义 分 开 ， 下 面 的 交互 式 会 话 显示 了 这 一 语法 : 
mysql» use rick 
Database changed 
mysql> CREATE table children ( 
-» childno INTEGER AUTO INCREMENT NOT NULL, 
-» fname varchar(30), 
-» age INTEGER, 
-» PRIMARY KEY(childno) 
-— 
Query OK, 0 rows affected (0.04 sec) 
mysql» 
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请 注意 我 们 是 如 何 跨越 多 行 输入 SQL 语 句 的 , MySQL 用 -> 提示 符 来 表示 我 们 位 于 延续 的 行 上 。 同 
样 请 注意 ， 正 如 我 们 之 前 提 到 的 那样 ， 我 们 使 用 分 号 结束 SQL 命 令 ， 表 示 我 们 已 经 完成 输入 并 准备 好 
让 数据 库 处 理 请 求 了 。 

如 果 出 现 了 错误 ，MySQL 人 允许 回 退 到 之 前 的 命令 ， 编 辑 它 并 通过 按 下 回 车 键 重新 输入 它 。 

(3) 现在 可 以 向 表 中 添加 数据 了 。 我 们 使 用 SQL 命 令 INSERT 来 添加 数据 。 因 为 我 们 定义 chilano 
列 为 AUTO_INCREMENT 列 ， 所 以 不 需要 为 此 列 提供 数据 ， 我 们 只 需 让 MySQL 分 配 一 个 唯一 的 数字 。 


mysql» INSERT INTO children(fname, age) VALUES("Jenny*, 21); 
Query OK, 1 row affected (0.00 sec) 


mysql» INSERT INTO children(fname, age) VALUES("Andrew*, 17); 
Query OK, 1 row affected (0.00 sec) 


我 们 可 以 使 用 sELECcT 从 表 中 提取 数据 来 检查 数据 是 否 被 正确 添加 了 : 
mysql» SELECT childno, fname, age FROM children; 


Nose asa cereus uias + 
| childno | fname | age | 
e +-------- Se * 
1 | Jenny 









sec) 


mysql> 


与 明确 的 列 出 我 们 想 选择 的 列 相 比 ， 你 也 可 以 使 用 星 号 〔(*) 代表 列 ， 这 将 列 出 表 中 的 所 有 列 。 


这 对 交互 式 的 使 用 会 很 方便 ， 但 在 产品 代码 中 ， 你 应 该 
你 启动 了 一 个 对 数据 库 服务 器 的 交互 式 会 话 ， 并 切换 到 rick 数 据 库 。 然 后 ， 你 输入 SQL 命令 创建 
表 ， 使 用 满足 需要 的 行 来 创建 列 。 一 旦 使 用 分 号 结束 了 SQL 命令 ，MySQL 就 将 创建 表 。 使 用 INSERT 
语句 添加 数据 到 新 表 中 ， 允 许 childno 列 被 自动 分 配 数 字 。 最 后 ， 使 用 SELECT 来 显示 表 中 的 数据 。 
我 们 在 本 章 中 没有 足够 的 篇 幅 来 介绍 SQL 的 所 有 细节 ， 更 不 用 说 讨论 数据 库 设 计 了 。 关 于 SQL 的 
更 多 信息 请 访问 www.mysql.com。 





终 明确 地 指定 你 想 要 选择 的 列 。 











827 图 形 化 工具 


在 命令 行 中 操作 表 和 数据 是 很 好 ， 但 是 如 今 很 多 人 更 喜欢 使 用 图 形 化 工具 。 

MySQL 有 两 个 主要 的 图 形 化 工具 : MySQL 管 理 器 MySQL Administrator) 和 MySQL 查 询 浏览 器 
(MySQL Query Browser)。 这 些 工具 的 具体 软件 包 名 称 取决 于 你 所 使 用 的 Linux 发 行 版 。 例 如 ，Red Hat 
发 行 版 中 对 应 的 软件 包 名 称 是 mysql-gui-tools 和 mysql-administrator。 对 Ubuntu 来 说 ， 你 可 能 需要 首先 
启用 Universe 库 ， 然 后 再 查找 mysql-admin。 

1. MySQL 查 询 浏览 器 

查询 浏览 器 是 一 个 相当 简单 、 但 又 很 有 效 的 工具 。 安 装 它 之 后 ， 你 可 以 通过 GUI 菜单 调用 它 。 执 
行 它 之 后 ， 你 会 看 到 一 个 登录 窗口 要 求 你 提供 连接 的 详细 信息 ， 如 图 8-4 所 示 。 

如 果 你 是 在 和 服务 器 同一 台 的 机 器 上 运行 它 ， 你 只 需 在 Server Hostname 处 输入 localhost 即 可 。 
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图 8-4 


- 旦 连接 上 服务 器 ， 你 将 看 到 一 个 简单 的 GUI 界 面 ， 如 图 8-5 所 示 。 它 允许 你 在 一 个 GUI shell 中 执 
行 查询 命令 、 提 供 图 形 化 编辑 的 所 有 优越 性 、 一 个 图 形 化 的 编辑 表格 中 数据 的 方式 和 一 些 针对 SQL 语 
法 的 帮助 屏幕 。 
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2. MySQL 管 理 器 

我 们 强烈 建议 你 尝试 一 下 MySQL 管 理 器 。 它 是 一 个 针对 MySQL 的 功能 强大 、 稳 定 和 易于 使 用 的 
图 形 化 接口 。 它 针对 Linux 和 Windows 都 提供 了 预 编译 的 版 本 如 果 你 需要 的 话 ， 它 甚至 还 提供 了 源 代 
码 ) 。 它 允许 你 通过 一 个 GUI 界面 同时 完成 管理 MySQL 服 务 器 和 执行 SQL 命令 的 工作 。 

执行 MySQL 管 理 器 时 ， 你 将 看 到 一 个 与 MySQL 查 询 浏览 器 的 连接 窗口 非常 相似 的 窗口 。 在 输入 
详细 信息 之 后 ， 你 将 看 到 一 个 主 控 页 面 ， 如 图 8-6 所 示 。 
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图 8-6 
如 果 想 要 通过 Windows 客 户 端 来 管理 MySQL 服 务 器 , 你 可 以 从 MySQL 网 站 上 的 GUI 工具 部 分 下 载 
Windows 版 本 的 MySQL 管 理 器 。 在 撰写 本 书 的 时 候 ， 该 网 站 的 下 载 页 面包 含 管理 器 、 查 询 浏览 器 和 
个 数据 库 迁移 工具 。Windows 版 本 的 状态 窗口 见 图 8-7， 你 可 以 看 到 ， 它 几乎 和 Linux 版 本 完全 一 样 。 





— 
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请 记 住 , 如果 你 一 直 按照 本 章 中 的 要 求 在 做 , 那么 你 已 对 MySQL 服 务 器 的 安全 进行 了 加 
固 ，root 用 户 只 能 从 localhost 进 行 连接 ， 而 不 能 从 网 络 中 的 任何 其 他 机 器 进行 连接 。 
一 旦 MySQL 管 理 器 已 运行 了 ， 你 就 可 以 浏览 一 下 它 的 不 同 配置 和 监控 选项 。 它 是 一 个 非常 易于 使 
用 的 工具 ， 但 我 们 在 本 章 中 没有 足够 的 篇 幅 来 详细 介绍 它 了 。 


8.3 使 用 C 语言 访问 MySQL 数据 


至 此 我 们 已 掌握 了 MySQL 的 入 门 知识 ， 下 面 让 我 们 探究 一 下 如 何 通过 应 用 程序 来 访问 MySQL， 
而 不 是 使 用 GUI 工具 或 基本 的 mysal 客 户 端 。 
我 们 可 以 通过 许多 不 同 的 编程 语言 来 访问 MySQL， 包 括 : 


Windows 本 地 程序 (如 Acecess) 也 可 以 通过 ODBC 驱 动 程序 来 访问 MySQL， 甚 至 还 有 针对 Linux 的 
ODBC 了 驱动 程序 ， 尽 管 我 们 没有 什么 理由 来 使 用 它 。 
本 章 中 ， 我 们 将 主要 讨论 C 语 言 接口 ， 因 为 这 是 本 书 的 重点 ， 而 且 许 多 其 他 语言 也 使 用 相同 的 
库 来 建立 连接 。 
8.3.1 连接 例 程 


Hci E 接 MySQL 数 据 库 包 含 两 个 步 又 : 
口 初始 化 一 个 连接 句柄 结构 ; 

口 实际 进行 连接 。 

首先 ， 使 用 mysql_init 来 初始 化 连接 句柄 : 
#include «mysql.h» 








MYSQL *mysql init(MYSQL *); 
通常 你 传递 NULL 给 这 个 例 程 ， 它 会 返回 一 个 指向 新 分 配 的 连接 句柄 结构 的 指针 。 如 果 你 传递 一 个 
已 有 的 结构 ， 它 将 被 重新 初始 化 。 这 个 例 程 在 出 错时 返回 NULL。 
目前 为 止 ， 你 只 是 分 配 和 初始 化 了 一 个 结构 。 你 仍然 需要 使 用 mysql_real_connect 来 向 一 个 连 
接 提供 参数 : 
MYSQL *mysql real connect(MYSQL *connection, 
Const char *server host, 
const char *sql user name, 
const char *sql password, 
const char *db name, 
unsigned int port number, 
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const char *unix socket name, 
unsigned int flags); 


指针 connection 必 须 指向 已 经 被 mysql_init 初 始 化 过 的 结构 。 其 他 参数 的 含义 都 相当 明了 ， 但 
是 ， 请 注意 server_host 既 可 以 是 主机 名 ， 也 可 以 是 耳 地 址 。 如 果 只 是 连接 到 本 地 机 器 ， 你 可 以 通过 
指定 1ocalhost 来 优化 连接 类 型 。 

sql_user_name 和 sql_passwora 的 含义 和 它们 的 字面 含义 一 样 。 如 果 登 录 名 为 NOULL， 则 假设 登录 
名 为 当前 Linux 用 户 的 登录 ID。 如 果 密 码 为 ROLL， 你 将 只 能 访问 服务 器 上 无 需 密码 就 可 访问 的 数据 。 
密码 会 在 通过 网 络 传输 前 进行 加 密 。 

port_number 和 unix_socket_name 应 该 分 别 为 Oo 和 NULL， 除 非 你 改变 了 MySQL 安 装 的 默认 设置 。 
它们 将 默认 使 用 合适 的 值 。 

最 后 ，flags 参 数 用 来 对 一 些 定义 的 位 模式 进行 OR 操作 ， 使 得 改变 使 用 协议 的 某 些 特性 。 对 于 像 
本 章 这 样 的 介绍 性 章节 来 说 ， 这 些 标志 都 没什么 用 处 ， 详 细 的 资料 请 参考 使 用 手册 。 

如 果 无 法 连接 ， 它 将 返回 NULL。mysql_error 函 数 可 以 提供 有 帮助 的 信息 。 

使 用 完 连接 之 后 ， 通 常 在 程序 退出 时 ， 你 要 像 下 面 这 样 调用 函数 mysal_close: 

void mysql close(MYSQL *connection); 

这 将 关闭 连接 。 如 果 连 接 是 由 mysql_init 建 立 的 ，MySQL 结 构 会 被 释放 。 指 针 将 会 失效 并 无 法 
再 次 使 用 。 保 留 一 个 不 需要 的 连接 是 对 资源 的 浪费 ， 但 是 重新 打开 连接 也 会 带 来 额外 的 开销 ， 所 以 你 
必须 自己 权衡 何 时 使 用 这 些 选项 。 

mysql_options 例 程 ( 仅 能 在 mysql_init 和 mysql_real_connect 之 间 调 用 ) 可 以 设置 一 些 选项 ， 


int mysql options(MYSQL *connection, enum option to set, 
const char *argument); 


因为 mysql_options 一 次 只 能 设置 一 个 选项 ， 所 以 每 设置 一 个 选项 就 得 调用 它 一 次 。 你 可 以 根据 
需要 多 次 使 用 它 ， 只 要 它 出 现在 mysql_init 和 mysql_real_connect 之 间 即 可 。 并 不 是 所 有 的 选项 都 
是 char 类 型 ， 因 此 它们 必须 被 转换 为 const char *。 表 8-11 中 列 出 了 3 个 最 常用 的 选项 。 与 往常 一 样 ， 
完整 的 选项 请 参见 在 线 手册 。 





表 8-11 
enum 选 项 实际 参数 类 型 说 明 
MySQL. OPT. CONNECT. TIMEOUT Const unsigned int * 连接 超时 之 前 的 等 待 秒 数 
MySQL_OPT_COMPRESS None， 使 用 NULL 网 络 连接 中 使 用 压缩 机 制 
MySQL. INIT. COMMAND const char * 每 次 连接 建立 后 发 送 的 命令 


一 次 成 功 的 调用 将 返回 0。 因 为 它 仅仅 是 用 来 设置 标志 ， 所 以 失败 总 是 意味 着 使 用 了 一 个 无 效 的 
选项 。 
如 果 要 设置 连接 超时 时 间 为 7 秒 ， 我 们 使 用 的 代码 片断 如 下 所 示 : 


unsigned int timeout = 7; 


connection - mysql init(NULL); 
ret = mysql options(connection, MYSQL OPT CONNECT TIMEOUT, (const char *)&timeout); 


if (ret) ( 
/* Handle error */ 
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} 


connection = mysql_real_connect (connection ... 

至 此 你 已 学 会 了 如 何 建立 和 关闭 连接 ， 下 面 我 们 使 用 一 个 简短 的 程序 来 测试 一 下 。 

首先 为 用 户 设置 一 个 新 的 密码 (在 下 面 的 代码 中 ， 是 本 机 上 的 rick 用 户 ) ， 然 后 创建 要 连接 的 数 
据 库 foo。 上 述 工 作对 你 来 说 都 应 该 很 熟悉 ， 所 以 我 们 将 只 显示 它们 执行 的 顺序 : 

$ mysql -u root -p 


Enter password: 
Welcome to the MySQL monitor. Commands end with ; or \g. 


mysql> GRANT ALL ON *.* TO rickélocalhost IDENTIFIED BY 'secret'; 
Query OK, 0 rows affected (0.01 sec) 


mysql» Aq 

Bye 

$ mysql -u rick -p 

Enter password: 

Welcome to the MySQL monitor. Commands end with ; or Wg. 


mysql» CREATE DATABASE foo; 
Query OK, 1 row affected (0.01 sec) 


mysql» Mq 

现在 你 已 创建 了 新 数据 库 。 如 果 直 接 在 mysql 命 令 行 中 输入 许多 创建 表 和 添加 数据 的 命令 ， 这 比 
较 容 易 出 错 ， 而 且 如 果 需 要 再 次 输入 这 些 命令 的 话 ， 这 种 方法 也 显得 不 够 高 效 。 为 此 ， 你 应 该 创建 一 
个 包含 你 所 需要 命令 的 文件 。 

这 个 文件 为 create_children.sql: 


-- Create the table children 


CREATE TABLE children ( 
childno int(11) NOT NULL auto, increment, 
fname varchar(30), 
age int(11), 
PRIMARY KEY (childno) 


-- Populate the table 'children' 


INSERT INTO children(chiláno, fname, age) VALUES (1,'Jenny',21); 
INSERT INTO children(childno, fname, age) VALUES (2,'Andrew',17); 
INSERT INTO children(childno, fname, age) VALUES (3,'Gavin',8); 
INSERT INTO children(childno, fname, age) VALUES (4, 'Duncan',6); 
INSERT INTO children(childno, fname, age) VALUES (5,'Emma',4); 

INSERT INTO children(childno, fname, age) VALUES (6,'Alex',15); 
INSERT INTO children(childno, fname, age) VALUES (7, 'Adrian',9); 


现在 ， 你 可 以 重新 登录 MySQL， 选 择 数据 库 foo， 并 执行 这 个 文件 。 为 简洁 起 见 ， 也 为 了 避免 将 
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密码 放 入 脚本 中 ， 我 们 将 密码 放 在 了 命令 行 上 : 
$ mysql -u rick --password=secret foo 
Welcome to the MySQL monitor. Commands end with ; or \g. 


mysql» V. create children.sql 
Query OK, 0 rows affected (0.01 sec) 


Query OK, 1 row affected (0.00 sec) 

我 们 已 删除 了 输出 中 的 许多 重复 行 ， 它 们 都 是 在 数据 库 中 创建 行 时 生成 的 。 现 在 你 有 一 个 用 户 、 
一 个 数据 库 和 一 个 保存 了 一 些 数据 的 表 ， 是 时 候 看 一 下 如 何 通过 代码 来 访问 这 些 数据 了 。 

下 面 是 源 文件 connect1.c， 它 以 用 户 名 rick 和 密码 secret 来 连接 本 机 服务 器 上 名 为 foo 的 数据 库 : 

#include «stdlib.h» 

#include <stdio.h> 

#include *mysql.h* 


int main(int argc, char *argv[]) ( 
MYSQL *conn ptr; 


conn ptr = mysql init(NULL); 

if (Iconn ptr) ( 
fprintf(stderr, "mysql init failedWn*); 
return EXIT FAILURE; 

) 


Conn ptr = mysql real connect(conn ptr, "localhost", "rick*, "secret", 
"foo*, 0, NULL, 0); 


if (conn ptr) ( 

printf ("Connection successWn'); 
} else { 

printf ("Connection failed\n"); 


mysql. close(conn ptr); 


return EXIT SUCCESS; 

) 

现在 开始 编译 这 个 程序 。 你 可 能 需要 同时 添加 incluae 路 径 和 库 文 件 路径 ， 以 及 指定 链接 的 库 模 
块 mysalclient。 在 某 些 系统 上 ， 你 可 能 还 需要 使 用 -1z 选 项 来 链接 压缩 库 。 在 我 的 系统 上 ， 需 要 的 
编译 指令 为 : 

$ gcc -I/usr/include/mysql connect1.c -L/usr/lib/mysql -lmysqlclient -o connecti 

你 可 能 需要 检查 是 否 安装 了 客户 端 软件 包 ， 它 们 的 安装 位 置 取 决 于 你 所 使 用 的 Linux 发 行 版 ， 你 
需要 根据 它们 的 位 置 对 上 面 的 编译 行 做 出 相应 的 调整 。 

运行 它 时 ， 你 只 会 看 到 一 条 连接 成 功 的 信息 : 

$ ./connectl 


Connection success 
$ 
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在 第 9 章 中 ， 我 们 将 演示 如 何 通过 创建 一 个 makefile 文 件 来 将 连接 程序 的 构建 自动 化 。 
可 以 看 出 ， 与 MySQL 数 据 库 建立 连接 是 很 简单 的 。 


8.3.2 ”错误 处 理 


在 我 们 介绍 更 复杂 的 程序 之 前 ， 了 解 一 下 MySQL 如 何 进行 错误 处 理 是 很 有 用 的 。MySQL 使 用 一 
系列 由 连接 句柄 结构 报告 的 返回 码 。 两 个 必 备 的 例 程 是 : 

unsigned int mysql errno(MYSQL *connection); 

和 

Char *mysql error(MYSQL *connection); 

你 可 以 通过 调用 mysql_errno 并 传递 连接 结构 来 获得 错误 码 ， 它 通常 都 是 非 0 值 。 如 果 未 设 定 错 
误 码 ， 它 将 返回 0。 因 为 每 次 调用 库 都 会 更 新 错误 码 ， 所 以 你 只 能 得 到 最 后 一 个 执行 命令 的 错误 码 。 
但 是 上 面 列 出 的 两 个 错误 检查 例 程 是 例外 ， 它 们 不 会 导致 错误 码 的 更 新 。 

mysql_errno 的 返回 值 实际 上 就 是 错误 码 ， 它 们 在 头 文件 errmsg.h 或 mysqala_error.h 中 定义 。 
这 两 个 文件 都 可 以 在 MySQL 的 include 目 录 中 找到 。 前 者 报告 客户 端 错误 ， 后 者 务 端 错误 。 

如 果 你 更 喜欢 文本 错误 信息 ， 也 可 以 调用 mysal_error， 它 提供 了 有 意义 的 文本 信息 而 不 是 单调 
的 错误 码 。 这 些 信息 被 写 入 一 些 内 部 静态 内 存 空间 中 ， 所 以 如 果 想 保存 错误 文本 ， 你 需要 把 它 复制 到 
别 的 地 方 。 

你 可 以 在 代码 中 添加 一 些 基本 的 错误 处 理 来 观察 它们 的 行为 。 你 可 能 已 经 注意 到 ， 当 调用 
mysql_real_connect 时 会 遇 到 一 个 问题 ， 因 为 它 在 失败 时 返回 NULL 指 针 ， 并 没有 提供 一 个 错误 码 。 
但 如 果 你 将 连接 句柄 作为 一 个 变量 ， 那 么 即使 mysql_real_connect 失 败 ， 你 仍然 能 够 处 理 它 。 

下 面 是 源 文件 connect2.c， 它 示例 了 如 何 使 用 非 动态 分 配 的 连接 结构 ， 以 及 如 何 编写 一 些 基本 
的 错误 处 理 代码 。 源 文件 中 修改 的 部 分 以 阴影 显示 : 


#include <stdlib.h> 
#include «stdio.h» 








#include "mysql.h* 


int main(int argc, char *argv[]) ( 
MYSQL my connection; 


mysql init (&my connection); 
if (mysql real connect(&my connection, *localhost', "rick", 
"I do not know", *foo*, 0, NULL, 0)) ( 

printf ("Connection successWn*); 
mysql_close (&my_connection) ; 

} else { 
fprintf(stderr, "Connection failed\n"); 
if (mysql errno(&my connection)) { 
fprintf(stderr, "Connection error td: $sin*, 

mysql errno(&my connection), mysql error(&my connection)); 

H 


) 


return EXIT SUCCESS; 
} 


通过 避免 使 用 返回 值 覆盖 连接 指针 的 方法 ， 你 可 以 很 容易 地 解决 mysql_real_connect 失 败 所 带 
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来 的 问题 。 不 仅 如 此 ， 这 也 是 另 一 种 使 用 连接 结构 的 好 例子 。 你 可 以 使 用 一 个 错误 的 用 户 或 密码 来 强 
制 生成 错误 ， 从 而 得 到 类 似 于 mysa]l 工具 提供 的 错误 码 。 

$ ./connect2 

Connection failed 

Connection error 1045: Access denied for user: 'rick8localhost' (Using 

password: YES) 

$ 


8.53 执行 SQL 语句 


你 已 能 够 连接 数据 库 并 正确 处 理 错误 了 ， 现 在 是 时 候 让 程序 做 一 些 实际 的 工作 了 。 执 行 SQL 语 句 
的 主要 API 函 数 被 恰当 的 命名 为 : 

int mysql query(MYSQL *connection, const char *query) 

不 是 太 难 吧 ? 这 个 例 程 接受 连接 结构 指针 和 文本 字符 串 形式 的 有 效 SQL 语句 〔 没 有 结束 的 分 号 ， 
这 与 mysql 工 具 不 同 )。 如 果 成 功 ， 它 返回 0。 对 于 包含 二 进 制 数据 的 查询 ， 你 可 以 使 用 第 二 个 例 程 
mysql_real_query, 但 是 在 本 章 中 ， 我 们 将 只 使 用 mysql_query。 

1. 不 返回 数据 的 SQL 语 句 

为 简单 起 见 ， 我 们 首先 来 看 一 些 不 返回 任何 数据 的 SQL 语句 ， UPDATE、DELETE 和 INSERT。 

我 们 将 在 这 里 介绍 另 一 个 重要 函数 ， 它 用 于 检查 受 查 询 影响 的 行 数 ; 

my ulonglong mysql affected rows(MYSQL *connection); 

你 很 可 能 首先 注意 到 的 是 这 个 函数 的 返回 值 类 型 很 不 常见 。 它 使 用 无 符号 类 型 是 出 于 移植 性 的 考 
虑 。 当 你 使 用 printf 时 ， 我 们 推荐 使 用 slu 格 式 将 其 转换 为 无 符号 长 整 型 。 这 个 函数 返回 受 之 前 执行 
的 UPDATE、INSERT 或 DELETE 查 询 影响 的 行 数 。 如 果 你 使 用 过 其 他 SQL 数据 库 ，MySQL 的 返回 值 可 能 
会 让 你 感到 意外 。 MySQL 返 回 的 是 被 一 个 更 新 操作 修改 的 行 数 , 但 许多 其 他 数据 库 将 仅仅 因为 记录 匹 
配 wHERE 子 句 就 把 它 视 为 已 经 更 新 过 。 

通常 对 于 mysql_ 系 列 函 数 ， 返 回 值 0 表示 没有 行 受到 影响 ， 正 数 则 是 实际 的 结果 ， 一 般 表示 受 语 
句 影响 的 行 数 。 

首先 ， 你 需要 在 数据 库 foo 中 创建 children 表 (如 果 你 之 前 没有 这 么 做 的 话 ) 。 删 除 〈 使 用 arop 
命令 ) 任何 已 有 的 表 以 确保 你 有 一 个 整洁 的 表 定义 ， 并 重新 发 送 在 AUTO_INCREMENT 列 中 使 用 的 任何 ID: 

$ mysql -u rick -p foo 

Enter password: 

Welcome to the MySQL monitor. Commands end with ; or Ag. 


mysql» DROP TABLE children; 
Query OK, 0 rows affected (0.58 sec) 


mysql» CREATE TABLE children ( 
->  childno int(11) AUTO INCREMENT NOT NULL PRIMARY KEY, 
-> fname varchar(30), 
-> age int 
-> ) 
Query ok, 0 rows affected (0.09 sec) 
mysql> 
现在 ， 在 connect2.c 源 文件 中 添加 一 些 代码 以 在 表 中 插入 一 个 新 行 ， 这 个 新 程序 被 命名 为 
insertl.c. 需要 注意 的 是 ,下面 代码 中 显示 的 折 行 是 由 于 物理 页 面 的 限制 , 你 通常 不 会 在 实际 的 SQL 
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语句 中 使 用 换行 符 , 除非 它 是 一 个 非常 长 的 语句 ,如 果 是 这 种 情况 , 你 可 以 在 行 尾 使 用 \ 字 符 以 允许 SQL 
语句 继续 到 下 一 
#include <stdlib.h> 
#include <stdio.h> 





#include "mysql.h* 


int main(int argc, char *argv[]) { 
MYSQL my_connection; 
int re: 





mysql init(&my connection); 
if (mysql real connect(&my connection, "localhost", 
"rick*, "secret", "foo", 0, NULL, 0)) ( 
printf(*Connection successi"); 


res = mysql query(&my connection, "INSERT INTO children(fname, age) 
VALUES('Ann', 3)*); 
if (ires) ( 
printf("Inserted lu rowsin', 
(unsigned long)mysql affected rows(&my connection)); 
) else ( 
fprintf(stderr, "Insert error td: $s n", mysql errno(&my connection), 


mysql. error (&my. connection]); 
) 


mysql close(&my connection); 
) else ( 
fprintf (stderr, "Connection failedin'); 
if (mysql errno(&my connection)) ( 
fprintf(stderr, "Connection error &d: $sWn*, 


mysql errno(&my connection), mysql error(&my connection)]; 
) 
) 


return EXIT SUCCESS; 
$ 


毫 不 奇怪 ， 我 们 插入 了 一 行 数据 。 
现在 ， 让 我 们 改变 代码 来 包含 UPDATE 而 不 是 INSERT， 并 且 观 察 受 影 响 的 行 是 如 何 被 报告 的 。 
mysql_errno (&my_connection), mysql error(&my connection)); 


H 
) 


res - mysql query(&my connection, "UPDATE children SET AGE - 4 
WHERE fname = 'Ann'"); 
if (ires) ( 
printf ("Updated &1u rowsWn*, 


(unsigned long)mysql affected rows(&my connection)]); 
) else ( 


fprintf(stderr, "Update error $d: $s|n', mysql errno(&my connection], 
mysql. error(&my connection)); 
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我 们 将 此 程序 叫做 upaatel .c。 它 试图 将 所 有 叫做 Ann 的 孩子 的 年 龄 设 为 4。 
现在 ， 假 设 children 表 中 有 如 下 数据 : 


mysql» SELECT * from CHILDREN; 





11 rows in set (0.00 sec) 

请 注意 有 4 个 孩子 的 名 字 匹 配 Ann。 如 果 执 行 upaatel， 你 可 能 会 认为 受 影响 的 行 数 为 4， 这 是 由 
WHERE 子 句 匹 配 的 行 数 。 但 是 ， 你 会 看 到 程序 报告 仅 有 2 行 受 影响 ， 这 是 因为 实际 需要 对 数据 进行 修改 
的 行 数 只 有 2 行 。 你 可 以 使 用 mysql_real_connect 的 CLIENT_FOUND_ROWS 标 志 来 获得 更 传统 的 报告 。 


if (mysql real connect(&my connection, "localhost", 





"rick", "secret", "foo", 0, NULL, CLIENT FOUND ROWS)) ( 

如 果 你 重 置 数据 库 中 的 数据 ， 然 后 再 运行 程序 ， 它 将 报告 受 影响 的 行 数 为 4。 

函数 mysql_affected_rows 还 有 最 后 一 个 古怪 之 处 , 它 出 现在 从 数据 库 中 删除 数据 的 时 候 。 如 时 
你 使 用 wHERE 子 句 删 除数 据 ， 那 么 mysql_affected_rows 将 返回 你 期 望 的 删除 的 行 数 。 但 如 果 在 
DELETE 语 句 中 没有 wHERE 子 句 ， 那 么 表 中 的 所 有 行 都 会 被 删除 ， 但 是 由 程序 返回 的 受 影响 行 数 却 为 0。 
这 是 因为 MySQL 优 化 了 删除 所 有 行 的 操作 ， 它 并 不 是 执行 许多 个 单行 删除 操作 。 这 一 行为 不 会 受 
CLIENT_FOUND_ROWSs 选 项 标志 的 影响 。 

2. 发 现 插入 的 内 容 

插入 数据 有 一 个 微小 但 至 关 重要 的 方面 。 还 记得 我 们 提 过 AUTO_INCREMENT 类 型 的 列 吗 ? 它 由 
MySQL 自 动 分 配 ID。 这 一 特性 非常 有 用 ， 特 别 是 当 你 有 许多 用 户 的 时 候 。 

让 我 们 再 次 查看 表 的 定义 : 

CREATE TABLE children ( 

Childno INTEGER AUTO INCREMENT NOT NULL PRIMARY KEY, | 
fname VARCHAR(30), 
age INTEGER 

Y» E 
正如 你 看 到 的 那样 ，childno 列 被 设 为 AUTO_INCREMENT 类 型 。 这 样 当然 很 好 ， 但 是 一 旦 你 插入 一 
行 ， 你 如 何 知 道 刚 插入 的 孩子 被 分 配 了 什么 数字 呢 ? 

你 可 以 执行 一 条 SELECT 语句 来 搜索 孩子 的 名 字 , 但 这 样 效率 会 很 低 ， 并 且 如 果 有 两 个 相同 名 字 的 
孩子 ， 这 将 不 能 保证 唯一 性 。 或 者 ， 如 果 同 时 有 多 个 用 户 快速 地 插入 数据 ， 那 么 可 能 在 更 新 操作 和 
SELECT 语句 之 间 会 有 其 他 行 被 插入 。 因 为 发 现 一 个 AUTO_INCREMENT 列 的 值 是 大 家 都 面临 的 一 个 共同 
问题 ， 所 以 MySQL 以 函数 LAST_INSERT_ID() 的 形式 提供 了 一 个 专门 的 解决 方案 。 
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无 论 何 时 MySQL 向 aUTO_INCREMENT 列 中 插入 数据 , MySQL 都 会 基于 每 个 用 户 对 最 后 分 配 的 值 进 
行 跟踪 。 用 户 程序 可 以 通过 sELEcCT 专 用 函数 LAST_INSERT_ID() 来 发 现 该 值 ， 这 个 函数 的 作用 有 点 像 
是 表 中 的 虚拟 列 。 


实验 提取 由 AUTO_INCREMENT 生 成 的 ID 


你 可 以 通过 插入 数据 到 表 中 并 执行 LAST_INSERT_ID() 函数 来 查看 其 作用 。 
mysql» INSERT INTO children(fname, age) VALUES('Tom', 13); 
Query OK, 1 row affected (0.06 sec) 

mysql> SELECT LAST INSERT ID(); 





1 row in set (0.01 sec) 
mysql» INSERT INTO children(fname, age) VALUES('Harry', 17); 





1 row in set (0.00 sec) 
mysql» 


每 次 插入 一 行 ，MySQL 就 分 配 一 个 新 的 ia 值 并 且 跟 踪 它 ， 使 得 你 可 以 用 LAsT_INSERT_ID() 来 提 
取 它 。 

如 果 想 通过 实验 查看 返回 的 数字 在 本 次 会 话 中 确实 是 唯一 的 ， 那 么 你 可 以 打开 另 一 个 会 话 并 插入 
另 一 行 数据 。 然 后 在 最 初 的 会 话 中 重新 执行 SELECT LAsT INSERT IDO ;语句 。 你 将 看 到 数字 并 没有 
发 生 改变 ， 这 是 因为 该 语句 返回 的 数字 是 由 当前 会 话 插入 的 最 后 一 个 数字 。 但 是 ， 如 果 执 行 SELECT * 
FROM children， 你 将 看 到 其 他 会 话 确实 已 插入 数据 了 。 


**w 在 C 程 序 中 使 用 自动 分 配 的 ID 


在 本 例 中 ， 我 们 将 修改 insert1 .< 程序 以 查看 这 些 操作 是 如 何在 C 语 言 中 实现 的 。 代 码 中 的 关键 修 
改 将 以 阴影 显示 。 我 们 把 修改 后 的 程序 命名 为 insert2.c。 


#include <stdlib.h> 
#include <stdio.h> 





#include "mysql.h* 


int main(int argc, char *argv[]) { 
MYSQL my connection; 
MYSQL RES *res ptr; 
MYSQL ROW sqlrow; 
int res; 
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mysql init(&my connection); 
if (mysql real connect(&my connection, "localhost", 
*rick*, *bar*, "rick", 0, NULL, 0)) ( 
printf ("Connection successWn'); 





res = mysql query(&my connection, "INSERT INTO children (fname, age) 
VALUES('Robert', 7)"); 
if (!res) { 
printf ("Inserted $1u rowsWn, (unsigned 
long)mysql affected rows(&my connection)); 
) eise ( 
fprintf(stderr, "Insert error $d: s\n", mysql errno(&my connection), 
mysql error(&my connection)]; 
) 


res = mysql query(&my connection, "SELECT LAST INSERT ID()"); 


if (res) ( 
printf ("SELECT error: %s\n", mysql error(&my connection]); 
) else ( 


res ptr = mysql use result(&my connection); 
if (res ptr) ( 
while ((sqlrow = mysql fetch row(res ptr))) ( 
printf(*We inserted childno %s\n", sqlrow[0]); 
) 
mysql. free result(res ptr); 


mysql close(&my connection); 
) else ( 
fprintf(stderr, "Connection failedin'); 
if (mysql errno(&my connection)) ( 
fprintf(stderr, "Connection error %d: $sWn*, 
mysql errno(&my connection), mysql error(&my connection)]; 
} 
) 


return EXIT SUCCESS; 
) 


下 面 是 这 个 程序 的 输出 : 


$ gcc -I/usr/include/mysql insert2.c -L/usr/lib/mysql -lmysqlclient -o insert2 
$ ./insert2 

Connection success 

Inserted 1 rows 

We inserted childno 6 

$ ./insert2 

Connection success 

Inserted 1 rows 

We inserted childno 7 
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实验 解析 

在 插入 一 行 之 后 ， 你 用 LAST_INSERT_ID() 函数 来 获取 分 配 的 ID， 就 像 常规 的 SELECT 语句 一 样 。 
然后 使 用 mysql use result () 从 执行 的 SELECT 语句 中 获取 数据 并 将 它 打印 出 来 ， 我 们 稍 后 将 解释 此 
函数 。 不 要 对 刚才 获取 数值 的 机 制 过 于 担心 ， 我 们 将 在 后 面 几 页 中 介绍 它们 。 





3. 返回 数据 的 语句 

SQL 最 常见 的 用 法 当然 是 提取 数据 而 不 是 插入 或 更 新 数据 。 数 据 是 使 用 SELECT 语句 提取 的 。 
MySQL 也 支持 使 用 SQL 语 句 SHOW、DESCRIBE 和 EXPLAIN 来 返回 结果 , 但 我 们 不 会 在 这 里 

涉及 它们 。 按照 惯例 ， 手 册 中 包含 了 对 这 些 语句 的 解释 . 


在 C 应 用 程序 中 提取 数据 一 般 需 要 下 面 4 个 步骤 : 

口 执行 查询 ; 

口 提取 数据 ; 

口 处 理 数据 ; 

OQ 必要 的 清理 工作 。 

就 像 之 前 的 INSERT 和 DELETE 语 名 一样 ， 你 将 使 用 mysql_query 来 发 送 SQL 语句 。 然 后 ， 你 使 用 
mysql_store_result 或 mysql_use_result 来 提取 数据 ， 具 体 使 用 哪个 函数 取决 于 你 想 如 何 提取 数 
据 。 接 着 ， 你 将 使 用 一 系列 mysql_fecch_row 调 用 来 处 理 数据 。 最 后 ， 使 用 mysql_free_result 释 放 
查询 占用 的 内 存 资源 。 

mysql_use_result 和 mysql_store_result 的 区 别 主 要 在 于 , 你 是 想 一 次 返回 一 行 数据 , 还 是 一 
次 返回 所 有 的 结果 。 当 你 预计 结果 集 比较 小 时 ， 后 者 会 更 加 合适 。 

一 次 提取 所 有 数据 的 函数 
你 可 以 使 用 mysql_score_result 在 一 次 调用 中 从 sELECT (或 其 他 返回 数据 的 语句 ) 中 提取 所 有 
数据 : 

MYSQL RES *mysql store result(MYSQL *connection); 

显然 ， 你 需要 在 成 功 调用 mysql_query 之 后 使 用 此 函数 。 这 个 函数 将 立刻 保存 在 客户 端 中 返回 的 
所 有 数据 。 它 返回 一 个 指向 结果 集结 构 的 指针 ， 如 果 失 败 则 返回 NULL。 

在 mysql_store_result 调 用 成 功 之 后 ， 你 需要 调用 mysql_num_rows 来 得 到 返回 记录 的 数目 , 我 
们 和 希望 这 是 个 正 数 ， 但 是 如 果 没有 返回 行 ， 这 个 值 将 是 0。 

my ulonglong mysql num rows(MYSQL RES *result); 

这 个 函数 接受 由 mysql_store_result 返 回 的 结果 结构 ， 并 返回 结果 集中 的 行 数 。 如 果 
mysql store. result 调 用 成 功 ，mysql_num_rows 将 始终 都 是 成 功 的 。 

通过 对 这 些 函数 的 组 合 使 用 ， 你 获得 了 一 种 提取 你 所 需要 数据 的 简单 方法 。 到 了 这 里 ， 所 有 数据 
对 于 客户 端 来 说 都 是 本 地 的 ， 你 不 再 需要 担心 可 能 的 网 络 或 数据 库 错误 了 。 对 返回 行 数 的 获取 将 有 助 
于 你 进行 随后 的 编程 。 

如 果 你 碰巧 使 用 的 是 一 个 特别 庞大 的 数据 集 ， 那 么 最 好 提取 小 一 些 、 更 容易 管理 的 信息 块 ， 因 为 
这 将 更 快 地 将 控制 权 返回 给 应 用 程序 ， 并 且 不 会 占用 大 量 的 网 络 资源 。 我 们 将 在 介绍 mysql_use_ 
result 的 时 候 ， 详 细 探讨 这 一 想法 。 

现在 , 你 可 以 使 用 mysql_fetch_row 来 处 理 它 , 也 可 以 使 用 mysal_data_seek、 mysql row seek 
和 mysql_row_tell 在 数据 集中 来 回 移动 。 下 面 让 我 们 来 看 看 这 些 函 数 。 
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口 mysql_fetch_row: 这 个 函数 从 使 用 mysql_score_result 得 到 的 结果 结构 中 提取 一 行 ， 并 把 
它 放 到 一 个 行 结 构 中 。 当 数据 用 完 或 发 生 错 误 时 返回 wULL。 我 们 将 在 下 一 节 中 回 过 来 处 理 行 
结构 中 的 数据 。 

MYSQL ROW mysql fetch row(MYSQL RES *result); 

O mysql. data. seek: 这 个 函数 用 来 在 结果 集中 进行 跳 转 , 设置 将 会 被 下 一 个 mysql_fetch_row 
操作 返回 的 行 。 参 数 offset 的 值 是 一 个 行 号 ， 它 必须 在 0 到 结果 和 集 总 行 数 减 1 的 范围 内 。 传 递 0 
将 会 导致 下 一 个 mysql_fetch_row 调 用 返回 结果 集中 的 第 一 行 。 
void mysql data seek(MYSQL RES *result, my ulonglong offset); 

O mysql row tell: 这 个 函数 返回 一 个 偏 移 值 ， 它 用 来 表示 结果 集中 的 当前 位 置 。 它 不 是 行 号 ， 
你 不 能 把 它 用 于 mysal_data_seek。 

MYSQL ROW OFFSET mysql row tell(MYSQL RES *result); 

口 但 是 ， 你 可 以 这 样 使 用 它 的 返回 值 : 

MYSQL ROW OFFSET mysql row seek(MYSQL RES *result, MYSQL ROW OFFSET offset); 
这 将 在 结果 集中 移动 当前 位 置 ， 并 返回 之 前 的 位 置 。 

这 对 函数 对 于 在 结果 集中 的 已 知 点 之 间 的 移动 非常 有 用 。 但 请 小 心 不 要 混淆 了 由 row_ 
tell 和 row_seek 使 用 的 偏 移 量 和 data_seek 使 用 的 行 号 。 否则， 结果 将 变 得 不 可 预知 。 

O 完成 了 对 数据 的 所 有 操作 后 ， 你 必须 明确 地 调用 mysql_free_result 来 让 MySQL 库 完成 善后 
处 理 。 
void mysql free result(MYSQL RES *result); 

口 完成 了 对 结果 集 的 操作 后 ， 你 必须 总 是 调用 此 函数 来 让 MySQL 库 清理 它 分 配 的 对 象 。 

e 提取 数据 

现在 可 以 编写 你 的 第 一 个 数据 提取 应 用 程序 了 。 你 想 要 选择 所 有 年 龄 大 于 5 的 记录 。 因 为 还 不 知 

道 如 何 处 理 这 些 数据 ， 所 以 你 将 仅仅 提取 它们 。 提 取 结 果 集 并 遍历 提取 数据 的 重要 代码 片断 用 阴影 显 
示 。 下 面 是 select1.c 的 源 代码 : 


#include «stdlib.h» 
#include <stdio.h> 


#include "mysql.h* 


MYSQL my_connection; 
MYSQL RES *res ptr; 
MYSQL ROW sglrow; 


int main(int argc, char *argv(]) ( 
int res; 


mysql init(&my connection); 
if (mysql real connect(&my connection, "localhost", "rick", 
"secret*, *foo*, 0, NULL, 0)) ( 





printf(*Connection successW*); 


res - mysql query(&my connection, "SELECT childno, fname, 
age FROM children WHERE age > 5"); 
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if (res) ( 
printf(*SELECT error: %s\n", mysql error(&my connection)); 
) else ( 
xes ptr = mysql store result(&my connection); 
if (res ptr) ( 
printf ("Retrieved $1u rowsin*, (unsigned long)mysql num rows(res ptr)); 
while ((sqlrow = mysql fetch row(res ptr))) ( 
printf ("Fetched data...Wn"); 
J 
if (mysql errno(&my connection)) ( 
fprintf(stderr, "Retrive error: %s\n", mysql error(&my connection]); 
) 
mysql free result(res ptr); ) 


) 
mysql close(&my connection); 


) else ( 
fprintf(stderr, "Connection failedWn*); 
if (mysql errno(&my connection)) ( 
fprintf(stderr, "Connection error $d: $sin*, 
mysql errno(&my connection), mysql error (&my, connection)); 
) 
) 


return EXIT SUCCESS; 





次 提取 一 行 数据 

为 了 逐 行 提取 数据 一 一 如 果 这 是 你 真正 想 要 的 ， 你 将 依靠 mysql_use_result 而 不 是 mysql_ 
store result. 

MYSQL RES *mysql use result(MYSQL *connection); 

与 mysql_store_result 函 数 一 样 ，mysql_use_result 在 遇 到 错误 时 也 返回 NULL。 如 果 成 功 ， 
它 返回 指向 结果 集 对 象 的 指针 。 但 是 ， 不 同 之 处 在 于 它 未 将 提取 的 数据 放 到 它 初始 化 的 结果 集中 。 

为 了 真正 得 到 数据 ， 你 必须 反复 调用 mysql_fetch_row 直 到 提取 了 所 有 的 数据 .如 果 没 
有 从 mysql_use_result 中 得 到 所 有 数据 ， 那 么 程序 中 后 续 的 提取 数据 操作 可 能 会 返回 遗 到 
破坏 的 信息 。 


那么 ,调用 mysql_use_result 和 调用 mysql_store_result 的 效果 有 何不 同 呢 ? 前 者 具备 资源 管 
理 方面 的 实质 性 好 处 , 但 是 它 不 能 与 mysql_data_seek、mysql_row_seek 或 mysql_row_tell 一 起 使 
用 ， 并 且 由 于 直到 所 有 数据 都 被 提取 后 才能 实际 生效 ，mysql_num_rows 的 使 用 也 受到 限制 。 

你 还 增加 了 时 延 ， 因 为 每 个 行 请 求 和 结果 的 返回 都 必须 通过 网 络 。 另 外 还 存在 一 种 可 能 性 是 ， 网 
络 连 接 可 能 在 操作 中 途 失败 ， 留 给 你 不 完整 的 数据 。 

但 是 ， 无 论 怎样 ， 这 些 都 不 会 抹 去 我 们 之 前 提 到 的 它 带 来 的 好 处 : 更 好 地 平衡 了 网 络 负载 ， 以 及 
减少 了 可 能 非常 大 的 数据 集 带 来 的 存储 开销 。 

把 select1.c 修 改 为 select2.c， 这 里 将 使 用 mysql_use_result 函 数 。 因 为 很 简单 ， 所 以 我 们 仅 
仅 以 阴影 方式 显示 修改 的 代码 片断 : 


296 $83 MySQL 





if (res) ( 
printf ("SELECT error: s\n", mysql error(&my connection]]; 
) else ( 
res ptr - mysql use result(&my connection); 
if (res ptr) ( 
while ((sqlrow = mysql fetch row(res ptr])) ( 
printf(*Fetched data...Wn*); 
) 
if (mysql errno(&my connection]) ( 
printf(*Retrive error: %s\n", mysql error(&my connection)]; 
) 
mysql free result(res ptr); 


) 

注意 观察 ， 在 提取 最 后 一 个 结果 之 前 ， 你 仍然 无 法 得 到 行 数 。 但 是 ， 通 过 早期 和 经 常 性 的 错误 检 
查 ， 可 以 使 得 程序 调整 为 使 用 mysql_use_result 变 得 更 加 容易 。 以 这 种 方式 编写 代码 可 以 减少 许多 
程序 后 期 修改 带 来 的 烦恼 。 

4. 处 理 返 回 的 数据 

现在 你 已 知道 了 如 何 提取 行 ， 下 面 可 以 学 习 如 何 处 理 返回 的 实际 数据 了 。 

如 同 大 多 数 SQL 数据 库 一 样 ，MySQL 返 回 两 种 类 型 的 数据 。 

口 从 表 中 提取 的 信息 ， 也 就 是 列 数据 。 

O 关于 数据 的 数据 ， 即 所 谓 的 元 数据 (metadata) ， 例 如 列 名 和 类 型 。 

让 我 们 首先 关注 如 何 将 数据 本 身 转化 为 有 用 的 形式 。 

mysql_field_count 函 数 提供 了 一 些 关 于 查询 结果 的 基 
中 的 字段 CD XH: 

unsigned int mysql field count(MYSQL *connection); 

在 更 通用 的 方式 下 ， 你 可 以 用 mysql_field_count 做 其 他 事情 ， 比 如 判断 为 何 mrysal_ 
store_result 的 调用 会 失败 。 例如 , 如 果 mysql_store_result 返 回 NULL, 但 是 mysql_field_ count 
返回 一 个 正 数 ， 你 可 以 推测 这 是 一 个 提取 错误 。 但 是 ， 如 果 mysql_field_count 返 回 9，， 则 表示 没有 
列 可 以 提取 ， 这 可 以 解释 为 何 存储 结果 会 失败 。 我 们 有 理由 认为 ， 你 应 该 了 解 一 个 特定 查询 应 返回 的 
列 数 。 因 此 ， 对 于 通用 查询 处 理 模块 或 任何 随意 构造 查询 的 情况 ， 这 个 函数 是 非常 有 用 的 。 

在 为 旧版 本 的 MySQL 所 写 的 代码 中 ， 你 可 能 会 看 到 使 用 mysal_num_fields 的 情况 。 它 

可 以 接受 一 个 连接 结构 或 一 个 结果 结构 指针 作为 参数 ， 并 返回 列 数 . 

如 果 抛 开 对 数据 的 格式 化 不 管 ， 那 么 你 已 经 知道 如 何 立刻 打印 出 数据 了 。 你 可 以 添加 简单 的 
display_row 函 数 到 select2.c 程 序 中 。 

请 注意 ， 为 了 简化 程序 ， 你 把 连接 、 结 果 和 mysql_fetch_row 返 回 的 行 信息 都 设 为 全 局 

的 。 我 们 并 不 建议 在 产品 代码 中 这 样 做 。 

(D 下 面 是 非常 简单 的 打印 数据 的 代码 : 


void display row() ( 
unsigned int field count; 





息 。 它 接受 连接 对 象 ， 并 返回 结果 集 


field count = 0; 
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while (field count < mysql field count(&my connection)) ( 
printf(*&s *, sqlrow[field count]]; 
field counts; 

} 

printf(*Wn*); 


(2) 将 它 添加 到 select2.c 中 ， 并 添加 一 个 声明 和 一 个 函数 调用 : 
void display row(); 


int main(int argc, char *argv[]) ( 
int res; 
mysql init(&my connection); 
if (mysql real connect(&my connection, "localhost*, "rick", 
"bar", *rick*, 0, NULL, 0)) ( 
printf ("Connection successWn"]; 


res = mysql query(&my connection, "SELECT childno, fname, 
age FROM children WHERE age > 5"]; 


if (res) ( 
Printf ("SELECT error: $sXn*, mysql error(&my connection)]; 
) else ( 
res ptr - mysql use result(&my connection); 
if (res ptr) ( 
while ((sqlrow = mysql fetch row(res ptr])) ( 
printf ("Fetched data... n*); 
display row(); 
) 
) 
) 


(3) 现在 ， 把 完成 的 代码 保存 为 select3.c。 最 后 ， 按 如 下 方式 编译 并 运行 select3: 


$ gcc -I/usr/include/mysql select3.c -L/usr/lib/mysql -lmysqlclient -o select3 
$ ./select3 

Connection success 

Fetched data... 

1 Jenny 21 

Fetched data... 

2 Andrew 17 


看 来 ， 程 序 可 以 运行 了 ， 虽 然 它 的 输出 不 是 特别 美观 。 但 是 你 并 未 考虑 结果 中 可 能 出 现 的 NULL 
值 。 如 果 想 要 打印 出 更 整洁 的 格式 化 (或 许 是 表格 化 ) 的 数据 ， 你 需要 同时 得 到 MySQL 返 回 的 数据 和 
元 数据 。 你 可 以 使 用 mysql_fetch_field 来 同时 将 元 数据 和 数据 提取 到 一 个 新 的 结构 中 : 

MYSQL FIELD *mysql fetch field(MYSQL RES *result); 


你 需要 重复 调用 此 函数 ， 直 到 返回 表示 数据 结束 的 NULL 值 为 止 。 然 后 ， 你 可 以 使 用 指向 字段 结构 
数据 的 指针 来 得 到 关于 列 的 信息 。 结 构 MysoL_FTELD 定 义 在 mysal .h 中 ， 如 表 8-12 所 示 。 
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表 8-12 
MySQL_FIELD 结 构 中 的 成 员 说 m 

char *name; 列 名 ， 为 字符 串 

char *table; 列 所 属 的 表 名 。 当 一 个 查询 要 使 用 到 多 个 表 时 ， 这 将 特别 有 用 。 注 意 ; 
对 于 结果 中 可 计算 的 值 如 MAx， 它 所 对 应 的 表 名 将 为 空 字符 串 

char *def; 如 果 调 用 mysql list fields (我 们 未 在 这 里 介绍 它 ) ， 它 将 包含 该 列 
的 默认 值 

enum enum field types type; 列 类 型 。 请 查看 紧 随 此 表 的 说 明 

unsigned int length; 列 宽 ， 在 定义 表 时 指定 

unsigned int max length; 如 果 使 用 mysql_store_result， 它 将 包含 以 字 节 为 单位 的 提取 的 最 长 列 
值 的 长 度 。 如 果 使 用 mysal_use_result， 它 将 不 会 被 设置 

unsigned int flags; 关于 列 定义 的 标志 ， 与 得 到 的 数据 无 关 。 常 见 标志 的 含义 都 很 明显 ， 它 


们 是 : NOT. NULL. FLAG. PRI KEY FLAG. UNSIGNED FLAG. AUTO INCREMENT. 
FLAG 和 BINARY_FLAG。 完 整 列表 可 参见 MySQL 文 档 


unsigned int decimals; 小 数 点 后 的 数字 个 数 。 仅 对 数字 字段 有 效 
列 类 型 相当 广泛 。 完 整 列表 见 头 文件 mysql_com.h 和 文档 。 常 见 的 有 : 


FIELD_TYPE_DECIMAL 

FIELD_TYPE_LONG 

FIELD_TYPE_STRING 

FIELD TYPE VAR STRING 

-个 特别 有 用 的 预定 义 宏 为 TS_NUM， 当 字段 类 型 为 数字 时 ， 它 返回 crue， 像 下 面 这 样 ， 

if (IS NUM(myslq field ptr-»type)) printf(*Numeric type field n*); 

在 更 新 程序 之 前 ， 我 们 还 需要 提 及 一 个 函数 : 

MYSQL FIELD OFFSET mysql field seek(MYSQL RES *result, 

MYSQL FIELD OFFSET offset); 

你 可 以 用 此 函数 来 害 盖 当前 的 字段 编号 ， 该 编号 会 随 每 次 mysql_fetch_fiel6 调 用 而 自动 增加 。 
如 果 给 参数 offset 传 递 值 0， 你 将 跳 回 第 一 列 。 

现在 你 得 到 信息 了 ， 你 需要 让 select 程 序 显示 和 某 一 指定 列 相关 的 所 有 额外 数据 。 

下 面 是 程序 select4.c， 我 们 在 这 里 重新 完整 地 显示 了 整个 程序 的 源 代码 ， 这 样 你 就 可 以 看 到 一 
个 完整 的 例子 了 。 注 意 ， 它 并 没有 试图 对 列 类 型 进行 详尽 的 分 析 。 

#include «stdlib.h» 

#include <stdio.h> 





#include "mysql.h* 


MYSQL my connection; 
MYSQL RES *res ptr; 
MYSQL ROW sqlrow; 


void display header(); 
void display row(); 


int main(int argc, char *argv[]) ( 
int res; 
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int first row = 1; /* Used to ensure we display the row header exactly once 
when data is successfully retrieved */ 


mysql init(&my connection); 
if (mysql real connect(&my connection, "localhost", "rick", 
*secret', "foo", 0, NULL, 0)) ( 





printf('Connection success\n"); 


res - mysql query(&my connection, "SELECT childno, fname, 
age FROM children WHERE age » 5"); 


if (res) ( 
fprintf(stderr, "SELECT error: $sVn*, mysql error(&my connection)); 
) else ( 


res ptr = mysql use result(&my connection); 
if (res ptr) ( 
while ((sqlrow = mysql fetch row(res ptr))) ( 
if (first row) ( 
display header(); 
first row = 0; 
} 
display_row(); 
X 
if (mysql errno(&my connection)) ( 
fprintf(stderr, "Retrive error: $sWn', 


mysql error(&my connection)); 
} 


mysql_free_result (res_ptr); 


Y 
mysql close(&my connection); 
) else ( 
fprintf(stderr, "Connection failedin"); 
if (mysql errno(&my connection)) ( 
fprintf(stderr, "Connection error &d: $s|n', 
mysql errno(&my connection), 
mysql error(&my connection)); 
) 


) 


return EXIT SUCCESS; 


void display header() ( 
MYSQL FIELD *field ptr; 


printf ("Colum details: Wn*); 

while ((field ptr = mysql fetch field(res ptr)) != NULL) { 
printf(*At Name: $sin*, field ptr-»name]; 
printf(*Wt Type: *); 
if (IS NUM(field ptr-»typel) ( 
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printf(*Numeric fieldWn*); 
) else ( 
switch(field ptr-»type) ( 
case FIELD TYPE VAR STRING: 
printf(*VARCHARW*) 7 
break; 
case FIELD TYPE LONG: 
printf(*LONGWn*); 
break; 
default: 
printf(*Type is $d, check in mysql com.hWn*, field ptr-»type); 
) /* switch */ 
) /* else */ 


printf(*Vt Max width $1dWn*, field ptr-»length); 
if (field ptr-»flags & AUTO INCREMENT FLAG) 
Printf ("\t Auto increments Wn"); 
printf(*W*); 
) /* while */ 


void display row() ( 
unsigned int field count; 


field count = 0; 

while (field count < mysql field count(&my connection)) ( 
if (sqlrow[field count]) printf(*$s ", sqlrow[field count]); 
else printf ("NULL"); 
field_count++; 

) 

printf ("\n"); 

) 


编译 并 运行 此 程序 时 ， 你 得 到 的 输出 为 : 
$ ./select4 
Connection success 
Column details: 
Name: childno 
Type: Numeric field 
Max width 11 
Auto increments 


Name: fname 
Type: VARCHAR 
Max width 30 


Name: age 
Type: Numeric field 
Max width 11 

Column details: 

1 Jenny 21 

2 Andrew 17 

$ 


84 CD 数据 库 应 用 程序 — 301 





这 仍然 不 是 很 漂亮 ， 但 它 很 好 地 阐明 了 如 何 通过 同时 处 理 原 始 数据 和 元 数据 来 更 有 效 地 使 用 数 
据 。 

你 还 可 以 通过 其 他 一 些 函 数 来 提取 字段 数组 并 在 列 间 进行 跳 转 。 但 通常 你 需要 使 用 的 所 有 例 程 都 
在 这 里 介绍 了 ， 感 兴趣 的 读者 也 可 以 在 MySQL 手 册 中 找到 更 多 信息 。 


8.3.4 更 多 的 函数 


表 8-13 中 显示 了 其 他 一 些 我 们 建议 你 了 解 的 API 函 数 。 一 般 情况 下 ， 到 目前 为 止 介绍 的 所 有 函数 
对 于 实现 一 个 可 工作 的 程序 已 足够 了 ， 但 是 ， 你 将 会 发 现下 面 这 个 挑选 过 的 列表 也 很 有 用 。 





表 8-13 
AP 用 WoW 
Char *mysql get client info(void); 返回 客户 端 使 用 的 库 的 版 本 信息 
Char *mysql get. host info(MySQL *connection); 返回 服务 器 连接 信息 
char "mysql get server info(MySQL *connection); ”返回 当前 连接 的 服务 器 的 信息 
char “mysql_info(MySQL*connection); 返回 最 近 执行 的 查询 的 信息 ， 但 是 仅仅 只 对 一 些 查询 
类 型 有 效 一 通常 是 INSERT 和 UPDATE 语 名 ， 否 则 返回 
NULL 
int mysql select db(MySQL *connection, const 如 果 用 户 拥有 合适 的 权限 ， 则 把 默认 数据 库 改 为 参数 
char *diname) ; 指定 的 数据 库 。 成 功 时 返回 0 
int mysql_shutdown (MySQL *connection,enum 如 果 用 户 拥有 合适 的 权限 ， 则 关闭 连接 的 数据 库 服务 
OO 38. 目前 关闭 级 别 必须 被 设置 为 SHUrpow_DEFAULT。 成 
功 时 返回 0 





8.4 ”CD 数据 库 应 用 程序 


现在 ， 你 将 看 到 如 何 创建 一 个 简单 的 数据 库 来 保存 CD 唱片 的 信息 ， 然 后 编写 一 些 代码 来 访问 这 
些 数据 。 为 尽量 保持 代码 的 简单 ， 使 其 易于 理解 ， 你 将 仅仅 使 用 3 个 数据 库 表 ， 而 且 它们 之 间 的 关系 
也 非常 简单 。 

首先 ， 创 建 一 个 新 的 数据 库 ， 然 后 将 其 作为 当前 的 数据 库 : 

mysql» create database blpcd; 

Query OK, 1 row affected (0.00 sec) 





mysql» use blpcd 
Connection id: 10 
Current database: blpcd 


mysql» 
现在 ， 你 已 准备 好 设计 和 创建 你 需要 的 表 了 。 
这 个 例子 会 比 以 前 的 稍微 复杂 一 点 ， 因 为 你 将 把 CD 唱片 分 成 3 个 不 同 的 元 素 : 艺术 家 或 组 合 )、 
主 标题 和 曲目 。 如 果 考虑 到 一 套 CD 收 藏 以 及 它 的 组 成 元 素 ， 你 会 意识 到 每 张 CD 都 由 不 同 的 曲目 组 成 ， 
但 不 同 CD 之 间 又 在 许多 方面 相互 关联 : 通过 艺术 家 或 组 合 、 通 过 制作 公司 、 通 过 音乐 表现 风格 等 。 
如 果 试 图 以 一 种 灵活 的 方式 来 保存 所 有 这 些 不 同 的 元 素 ， 你 的 数据 库 将 变 得 相当 复杂 ， 但 在 本 例 
中 ， 你 将 仅 限 于 使 用 两 种 最 重要 的 关系 。 
首先 ， 每 张 CD 由 不 同 数目 的 曲目 组 成 ， 所 以 你 将 把 曲目 数据 储存 在 一 个 独立 于 其 他 CD 数据 的 表 
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中 。 其 次 ， 每 位 艺术 家 〈 或 乐队 ) 经 常会 有 多 张 专辑 ， 所 以 只 将 艺术 家 的 信息 存 [ 艺术家。 
储 一 次 ， 然 后 单独 提取 属于 该 艺术 家 的 所 有 CD 是 非常 有 用 的 。 我 们 不 会 尝试 将 乐 
队 拆 分 成 不 同 的 艺术 家 (乐队 的 每 个 成 员 可 能 都 有 属于 自己 的 专辑 ) 或 处 理 合集 
CD 一 一 这 是 为 了 尽量 保持 例子 的 简单 ! 

同样 ， 你 也 需要 保持 关系 的 简单 一 一 每 个 艺术 家 (也 可 能 是 乐队 名 称 ) 可 能 制 
作 一 张 或 多 张 CD， 每 张 CD 包含 一 个 或 多 个 曲目 。 这 种 关系 如 图 8-8 所 示 。 


8.4.1 创建 表 曲目 


现在 ， 你 需要 确定 表 的 实际 结构 。 我 们 从 主 表 一 一 CD 表 开 始 ， 它 保存 大 部 分 图 8.8 
。 你 需要 保存 一 个 CD ID、 一 个 分 类 号 、 一 个 标题 以 及 一 些 你 自己 的 标注 。 
要 一 个 来 自 artist 表 的 ID 号 来 表明 是 哪 位 艺术 家 制作 了 这 张 专辑 。 
artist 表 很 简单 ， 它 仅仅 保存 艺术 家 的 名 字 和 一 个 唯一 的 艺术 家 ID 号 。crack 表 也 很 简单 ， 你 只 
需要 一 个 CD ID 来 表明 曲目 属于 哪 张 CD、 一 个 曲目 号 和 一 个 曲目 标题 。 
首先 是 CD 表 : 
CREATE TABLE cd ( 
id INTEGER AUTO INCREMENT NOT NULL PRIMARY KEY, 
title VARCHAR(70) NOT NULL, 
artist id INTEGER NOT NULL, 
catalogue VARCHAR(30) NOT NULL, 
notes VARCHAR(100) 
) 
这 创建 了 表 ca， 它 包含 下 面 一 些 列 。 
口 ia 列 ， 包 含 一 个 自动 增加 的 整数 ， 它 是 表 的 主键 。 
口 最 长 为 70 个 字符 的 cicle。 
口 artist_id， 在 artist 表 中 使 用 的 一 个 整数 。 
O 最 长 为 30 个 字符 的 catalogue 号 。 
口 最 长 为 100 个 字符 的 notes。 
注意 ， 只 有 notes 列 可 以 为 NULL， 所 有 其 他 的 列 都 必须 含有 值 。 
下 面 是 artist 表 : 
CREATE TABLE artist ( 
id INTEGER AUTO_INCREMENT NOT NULL PRIMARY KEY, 
name VARCHAR(100) NOT NULL 
) 
你 又 有 了 一 个 ia 列 和 一 个 艺术 家 name 列 。 
最 后 是 track 表 : 
CREATE TABLE track ( 
cd.id INTEGER NOT NULL, 
track id INTEGER NOT NULL, 
title VARCHAR(70), 
PRIMARY KEY(cd id, track id) 








CD 唱片 























Ja s 
注意 ,这 次 你 用 不 同 的 方法 来 声明 主键 track 表 的 不 寻常 之 处 在 于 每 张 CD 的 ID 会 出 现 多 次 ,而 
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对 于 任何 指定 曲目 的 ID， 例 如 曲目 1， 也 会 在 不 同 的 CD 中 出 现 多 次 。 但 是 ， 这 两 者 的 结合 将 永远 是 唯 
一 的 ， 所 以 我 们 将 主键 声明 为 这 两 列 的 结合 。 这 被 称 为 是 联合 键 ， 因 为 它 由 多 列 联合 组 成 。 

将 这 些 SQL 语句 存储 在 文件 create_table.sql 中 ， 并 将 该 文件 保存 在 当前 目录 中 ， 然 后 开始 创 
建 数据 库 及 其 中 的 表 。 当 这 些 表 已 存在 时 ， 我 们 提供 的 脚本 样 例 还 包含 额外 的 命令 用 于 丢弃 这 些 表 ， 
但 默认 情况 下 ， 这 些 命令 是 被 注释 掉 的 。 

$ mysql -u rick -p 


Enter password: 
Welcome to the MySQL monitor. Commands end with ; or \g. 


mysqi» use blpcd; 

Database changed 

mysql> Y. create tables.sql 

Query OK, 0 rows affected (0.04 sec) 


Query OK, 0 rows affected (0.10 sec) 
Query OK, 0 rows affected (0.00 sec) 


mysql» 
注意 我 们 使 用 \ .命令 将 create_ tables .sql 文 件 作为 输入 。 
你 也 可 以 使 用 MySQL 查 询 浏览 器 (MySQL Query Browser) ， 通 过 执行 SQL 或 简单 地 输入 数据 来 
创建 表 。 
旦 创建 好 表 ， 你 就 可 以 通过 MySQL 管 理 器 (MySQL Administrator) 来 查 
在 图 中 ， 你 正在 检查 blpcd 数 据 库 的 indices 标 签 〈 或 schema， 这 取决 于 你 的 首选 术语 ) 。 


Me EML Viem b MYSOL enterproe Mel 
eee neman Sli we enisi ede 
Ð serce Contre 
D saws reeneten || D Mipdceo nsns tet 
RA iner warmnrrnron 





如 图 8-9 所 示 。 


PRIMARY BTAFE ~ UNIOUE 

















pun "ota PAIMARY STRE umove 
m" 1 scengng 
O track ja 2 Ascendng 

图 8-9 


你 可 以 通过 选择 编辑 表 〈 在 Tables 标 签 中 右键 单 击 或 双击 表 名 ) 看 到 列 的 详细 信息 。 如 图 8-10 所 


示 。 





























图 8-10 


你 注意 到 图 8-10 中 针对 ca_ig 列 和 track_ia 列 的 两 个 关键 符号 了 吗 ? 它 表示 这 两 个 列 都 属于 联合 
主键 。 曲 目标 题 可 以 为 NULL GERNOT NULL 并 没有 被 选中 ) 表示 我 们 允许 CD 曲目 没有 标题 ， 这 种 情 
况 虽然 少见 ， 但 并 非 不 会 出 现 。 

84.2 添加 数据 

现在 ， 你 需要 添加 一 些 数据 。 最 好 的 检查 数据 库 设 计 的 方法 是 ， 添 加 一 些 样本 数据 并 检查 它们 是 
否 都 能 正常 工 

我 们 在 这 里 将 仅仅 展示 一 个 测试 输入 数据 的 例子 ， 因 为 所 有 的 输入 都 基本 相似 一 一 它们 仅仅 是 加 
载 不 同 的 表 ， 所 以 它 并 不 是 理解 发 生 何事 的 关键 。 下 面 有 两 个 要 点 需要 注意 。 

O 这 个 脚本 将 删除 任何 已 有 的 数据 以 确保 脚本 是 干净 的 。 

O 在 ID 字段 中 插入 数值 ， 而 不 是 让 AUTO_INCREMENT 来 自动 分 配 。 在 这 里 这 样 做 会 更 安全 ， 因 为 

不 同 的 插入 操作 需要 知道 哪些 值 已 被 使 用 以 确保 数据 关系 是 完全 正确 的 , 因此 最 好 强制 指定 数 
值 ， 而 不 是 允许 AUTO_INCREMENT 函 数 来 自动 分 配 数值 。 

这 个 文件 叫做 insert_qata.sql， 它 可 以 使 用 你 前 面 见 到 的 \ .命令 来 执行 。 

--- Delete existing data 

delete from track; 


delete from cd; 
delete from artist; 





-- Now the data inserts 


--- First the artist (or group) tables 

insert into artist(id, name) values(l, 'Pink Floyd'); 
insert into artist(id, name) values(2, 'Genesis'); 
insert into artist(id, name) values(3, 'Einaudi') 
insert into artist(id, name) values(4, 'Melanie C'); 
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--- Then the cd table 

insert into cd(id, title, artist id, catalogue) values(1, 'Dark Side of the Moon', 
1, 'B000024D4P' 
insert into cd(id, title, artist id, catalogue) values(2, 'Wish You Were Here', 1, 
'B000024D4S') ; 

insert into cd(id, title, artist id, catalogue) values(3, 'A Trick of the Tail', 2, 
'B000024EXM') ; 

insert into cd(id, title 
Pound', 2, 'B000024E9M' 
insert into cd(id, title, artist id, catalogue) values(5, 'I Giorni', 3, 
*B000071WEV'); 

insert into cd(id, title, artist id, catalogue) values(6, 'Northern Star', 4, 
*B00004YMST' ) ; 





artist id, catalogue) values(4, 'Selling England By the 








- populate the tracks 
insert into track(cd id, track id, title) values(1, 1, 'Speak to me'); 

insert into track(cd id, track id, title) values(1, 2, 'Breathe'); 

接着 是 专辑 中 剩 下 的 曲目 ， 然 后 是 下 一 张 专辑 ; 

insert into track(cd id, track id, title) values(2, 1, 'Shine on you crazy 
diamond'); 

insert into track(cd id, track id, title) values(2, 2, 'Welcome to the machine']; 
insert into track(cd id, track id, title) values(2, 3, 'Have a cigar'); 

insert into track(cd id, track id, title) values(2, 4, 'Wish you were here']; 
insert into track(cd id, track id, title) values(2, 5, 'Shine on you crazy diamond 
pt.2'); 

等 等 

insert into track(cd id, track id, title) values(5, 1, 'Melodia Africana (part 
11; 

insert into track(cd id, track id, title) values(5, 2, 'I due fiumi'); 

insert into track(cd id, track id, title) values(5, 3, 'In unV'altra vita'); 
直到 最 后 的 曲目 : 

insert into track(cd id, track id, title) values(6, 11, 'Closer'); 

insert into track(cd id, track id, title) values(6, 12, 'Feel The Sun'); 


接着 将 它 保存 为 pop_tables .sql， 并 像 前 面 那样 在 mysql 提 示 符 下 用 \ .命令 执行 它 。 


注意 在 cd 5 (1Giomi ) 曲目 3 中 ,曲目 In un'altra vita 中 有 搬 号 . 为 了 将 其 插入 到 数据 库 中 ， 
Ak ob JR Foe CU) 来 引用 搬 号 。 


现在 是 时 候 检 查 你 的 数据 是 耕 合理 了 。 你 可 以 使 用 mysql 命 令 行 客户 端 和 一 些 SQL 语 句 来 进行 检 
首先 ， 从 数据 库 中 选 出 每 张 专辑 的 头 两 首 曲目 : 

SELECT artist.name, cd.title AS "CD Title', track.track id, track.title AS 

"Track' FROM artist, cd, track WHERE artist.id - cd.artist id AND track.cd id 

= cd.id AND track.track id < 3 


如 果 在 MySQL 查 询 浏览 器 中 尝试 这 个 SQL 语 句 ， 你 可 以 看 到 提取 出 的 数据 很 好 ， 如 图 8-11 所 万 
这 个 SQL 语 句 看 起 来 很 复杂 ， 但 是 如 果 你 将 该 语句 分 解 开 来 看 ， 它 就 不 是 那么 难 理解 了 。 

先 忽略 SELECT 命令 中 的 As 部 分 ， 第 一 部 分 仅仅 是 : 

SELECT artist.name, cd.title, track.track id, track.title 


它 只 是 通过 使 用 标记 tablename .column 来 说 明 你 想 要 显示 哪些 列 。 
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图 8-11 


SELECT 语句 的 As 部 分 SELECT artist.name,cd.title AS "CD Title",track.track_id 和 
track.title AS "Track" 只 是 在 输出 中 重 命名 列 名 。 因 此 ， 来 自 ca 表 的 citle 列 〈cd.title) 的 标 
题 栏 被 命名 为 “CD Title”，*rack.cicle 列 被 命名 为 “Track”。as 的 使 用 给 了 我 们 更 友好 的 输出 ， 它 
是 在 命令 行 中 针对 SQL 语句 的 一 个 有 用 的 字句 ， 但 当 你 通过 其 他 编程 语言 来 调用 SQL 语句 时 ， 你 几乎 
不 会 用 到 它 。 

接 下 来 的 部 分 也 非常 地 简单 易 懂 ， 它 告诉 服务 器 你 使 用 的 表 名 : 

FROM artist, cd, track 

WHERE 子 句 是 需要 点 技巧 的 部 分 : 

WHERE artist.id = cd.artist id AND track.cd id = cd.id AND track.track id < 3 

第 一 部 分 告诉 服务 器 artist 表 中 的 ID 应 与 ca 表 中 的 artist_ia 相 同 。 记 住 ， 你 仅仅 保存 了 一 次 艺 
术 家 的 名 字 并 在 cD 表 中 使 用 ID 来 引用 它 。 下 一 部 分 ，track.ca_ia = ca.id， 为 表 track 和 ca 做 同样 
的 事情 ， 即 告诉 服务 器 track 表 的 ca_ia 列 应 与 ca 表 中 的 iG 列 相同 。 第 三 部 分 ，track.track_id <3, 
减少 了 返回 数据 的 数量 以 使 得 你 仅仅 从 每 张 CD 中 得 到 曲目 1 和 曲目 2。 最 后 ， 你 使 用 AND 把 3 个 条 件 结 
合 起 来 ， 因 为 你 想 让 这 3 个 条 件 同时 都 为 真 。 

8.4.3 使 用 C 语言 访问 数据 

我 们 并 不 准备 在 本 章 中 编写 一 个 带 有 GUI 的 完整 的 应 用 程序 ， 而 是 专心 于 编写 一 个 接口 文件 ， 从 
而 允许 你 以 一 种 合理 而 又 简单 的 方式 通过 C 语 言 来 访问 数据 。 编 写 这 类 代码 的 一 个 常见 问题 是 无 法 知 
道 返 回 的 结果 数 ， 以 及 如 何在 客户 端 代码 和 访问 数据 库 的 代码 间 传 递 这 些 结果 。 在 这 个 应 用 程序 中 ， 
为 了 保持 简单 并 专注 于 数据 库 接口 (这 是 代码 中 的 重要 部 分 )， 我 们 将 使 用 固定 大 小 的 结构 。 但 在 实 
际 的 程序 中 ， 这 可 能 是 不 能 接受 的 。 一 种 常见 的 解决 方法 〈 它 同时 也 有 助 于 减少 网 络 流量 ) 是 每 次 总 
是 提取 一 行 数据 ， 正 如 你 在 本 章 前 面 看 到 的 函数 mysal_use_result 和 mysql_fecch_row 一 样 。 
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1. 接口 定义 
我 们 先 从 头 文件 app_mysal .bh 开始 ， 它 定义 了 结构 和 函数 : 
首先 是 一 些 结构 : 
/* A simplistic structure to represent the current CD, excluding the track 
information */ 
struct current cd st ( 
int artist id; 
int cd i 
Char artist name[100]; 
char title[100]; 
Char catalogue[100]; 
h 





/* A simplistic track details structure */ 
struct current tracks st ( 

int cd id; 

char track[20][100]; 
E 


(define MAX CD RESULT 10 
struct cd search st ( 
int cd id[MAX CD RESULT]; 

y 

然后 是 一 对 函数 ， 它 们 用 于 连接 数据 库 以 及 从 数据 库 断 开 连 接 ; 

/* Database backend functions */ 

int database start(char *name, char *password); 

void database end(); 

现在 ， 我 们 转向 操纵 数据 的 函数 。 注意， 没有 创建 或 删除 艺术 家 的 函数 。 你 将 在 后 台 实现 它 ， 根 
据 需 要 创建 艺术 家 条 目 ， 然 后 当 它们 不 再 被 任何 专辑 使 用 的 时 候 将 其 删除 。 

/* Functions for adding a CD */ 

int add cd(char *artist, char *title, char *catalogue, int *cd id); 

int add tracks(struct current tracks st *tracks); 

/* Functions for finding and retrieving a CD */ 

int find cds(char *search str, struct cd search st *results); 

int get cd(int cd id, struct current cd st *dest); 

int get cd tracks(int cd id, struct current tracks st *dest); 

/* Function for deleting items */ 

int delete cd(int cd id); 

搜索 函数 相当 通用 你 传递 一 个 字符 串 ， 然 后 它 将 在 artist、title 或 catalogue 条 目 中 搜索 该 
字符 串 。 

2. 测试 应 用 程序 接口 

在 实现 接口 之 前 ， 你 将 编写 一 些 代码 来 使 用 它 。 这 看 起 来 可 能 有 点 奇怪 ， 但 在 开始 实现 接口 之 前 
了 解 一 下 它 将 如 何 运转 通常 是 个 好 方法 。 

下 面 是 app_test .c 的 源 代 码 。 首 先是 一 些 incluaes 和 structs: 


finclude <stdlib.h> 
#include <stdio.h> 
#include <string.h> 
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Pinclude "app mysql.h* 


int main() ( 
struct current cd st cd; 
struct cd search st cd res; 
Struct current tracks st ct; 


int cd id; 
int res, i; 
应 用 程序 要 做 的 第 一 件 事 始终 是 ， 初 始 化 一 个 数据 库 连接 并 提供 一 个 正确 的 用 户 名 和 密码 一定 
要 用 自己 的 用 户 名 和 密码 ): 


database_start ("rick", "secret"); 
然后 ， 测 试 添加 一 张 CD: 


res = add cd(*Mahler*, "Symphony No 1*, *4596102*, &cd id); 
printf('Result of adding a cd was %d, cd id is d\n", res, cd id); 


memset(&ct, 0, sizeof(ct)); 

ct.cd id - cd id; 

Strcpy(ct.track[0], "Langsam Schleppend'); 
strcpy(ct.track[1], “Kraftig bewegt"); 
strcpy(ct.track[2], "Feierlich und gemessen"); 
strcpy(ct.track[3], "Sturmisch bewegt"); 

add, tracks (&ct) ; 


现在 ， 搜 索 CD， 并 从 找到 的 第 一 张 CD 中 提取 信息 : 


res = find cds(*Symphony*, &cd res); 
printf(*Found $d cds, first has ID %d\n", res, cd res.cd id[0]); 


res = get cd(cd res.cd id[0], &cd); 
printf('get cd returned d\n", res); 


memset(kct, 0, sizeof(ct)); 
res = get. cd tracks(cd res.cd id[0], &ct); 
Pprintf("get cd tracks returned &din', res); 
printf(*Title: $sin*, cd.title); 
i= 0; 
while (i < res) { 
Printf("\ttrack &d is %s\n", i, ct.tracklil); 
ies; 
) 
最 后 ， 删 除 CD: 
res = delete cd(cd res.cd id[0]); 
printf(*Delete cd returned $din', res); 


然后 断 开 连接 并 退出 : 


database_end(); 
return EXIT SUCCESS; 


) 
3. 实现 接口 
现在 是 最 困难 的 部 分 : 实现 你 指定 的 接口 。 这 些 都 包含 在 文件 app_mysal .c 中 。 
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首先 是 一 些 基本 的 incluaes、 你 需要 的 全 局 连接 结构 和 一 个 标志 abconnectea， 你 将 使 用 它 来 确 
保 程序 不 会 在 没有 建立 连接 的 情况 下 尝试 访问 数据 。 你 还 使 用 一 个 内 部 函数 get_artist_id 来 改善 代 
码 的 结构 。 


#include «stdlib.h» 
#include «stdio.h» 
#include <string.h> 


#include "mysql.h* 
#include "app_mysql.h" 


static MYSQL my connection; 
static int dbconnected - 0; 


Static int get artist id(char *artist); 


连接 到 一 个 数据 库 是 非常 简单 的 ， 就 像 你 在 本 章 前 面 看 到 的 那样 。 断 开 连 接 就 更 加 简单 了 : 


int database_start (char *name, char *pwd) { 
if (dbconnected) return 1; 


mysql init(&my connection); 
if (!mysql real connect(&my connection, "localhost", name, pwd, "blpcd*, 0, 
NULL, 0)) ( 
fprintf(stderr, "Database connection failure: d, $sWn', 
mysql errno(&my connection), mysql error(&my connection)); 
return 0; 
) 
dbconnected = 1; 
return 1; 


) /* database start */ 


void database end() ( 
if (dbconnected) mysql close(&my connection]; 
dbconnected - 0; 

) /* database end */ 


现在 通过 函数 add_ca 开 始 真正 的 工作 。 首先 需要 给 出 一 些 声明 和 进行 健全 性 检查 以 确保 你 已 连接 
到 了 数据 库 。 你 将 在 所 有 编写 的 可 外 部 访问 的 函数 中 看 到 这 一 切 。 
记 住 ， 我 们 说 过 代码 将 自动 关注 艺术 家 的 名 字 : 


int add cd(char *artist, char *title, char *catalogue, int *cd id) ( 


MYSQL RES *res ptr; 
MYSQL ROW mysglrow; 


int res; 

char is[250]; 
char es[250] 
int artist id - -1; 
int new cd id - -1; 





if (!dbconnected) return 0; 
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下 一 步 是 检查 艺术 家 是 否 已 经 存在 ， 如 果 不 存 在 ,你 就 创建 一 个 . 这 些 都 由 函数 get_ artisc ia 
来 实现 ， 你 将 在 稍 后 看 到 该 函数 。 
artist id = get artist idlartist]; 
在 有 了 一 个 artist_id 之 后 ， 你 可 以 插入 主 CD 记 录 了 。 注 意 ， 我 们 使 用 mysql_escape_string 
来 保护 CD 标题 中 的 任何 特殊 字符 。 
mysql escape string(es, title, strlen(title)); 
sprintf(is, "INSERT INTO cd(title, artist id, catalogue) 
VALUES('$s', Sd, '%s')", es, artist id, catalogue); 
res = mysql query(&my connection, is); 
if (res) { 
fprintf(stderr, "Insert error %d: $sWn', 
mysql errno(&my connection), mysql error(&my connection)); 
return 0; 
) 
当 你 为 此 CD 添加 曲目 时 ， 你 需要 知道 插入 CD 记录 时 使 用 的 ID。 你 把 此 列 设置 为 自动 增加 列 ， 因 
此 数据 库 会 自动 分 配 ID， 但 是 你 需要 明确 地 提取 数值 。 这 可 以 通过 使 用 你 在 本 章 前 面 见 到 的 特殊 函数 
LAST_INSERT_ID 来 完成 。 
res = mysql query(&my connection, "SELECT LAST_INSERT_ID()"); 
if (res) ( 
Printf ("SELECT error: %s\n", mysql error(&my connection)]; 
return 0; 
else ( 
res ptr - mysql use result(&my connection]; 
if (res ptr) ( 
if ((mysqlrow = mysql fetch row(res ptr))) ( 
sscanf(mysqlrow[0], "ta", &new cd id); 
) 
mysql free result(res ptr); 
) 
你 不 必 担 心 其 他 客户 端 同时 插入 CD 时 会 导致 [D 混 乱 ，MySQL 会 基于 每 个 客户 的 连接 来 跟踪 分 配 
的 ID， 所 以 即使 你 在 提取 ID 之 前 有 另 一 个 程序 插入 了 一 张 CD， 你 仍然 可 以 得 到 对 应 于 你 的 行 的 ID， 
而 不 是 由 其 他 程序 插入 的 行 所 对 应 的 ID。 
最 后 ， 设 置 新 加 入 行 的 ID 并 返回 成 功 或 失败 : 
*cd id = new cá id; 
if (new cd id !- -1) return 1; 
return 0; 
) 
) /* add cd */ 
现在 ， 让 我 们 看 一 下 gec_arcist_id 的 实现 ， 其 过 程 跟 插入 CD 记录 非常 相似 : 
/* Find or create an artist id for the given string */ 
Static int get artist id(char *artist) ( 
MYSQL RES *res ptr; 
MYSQL ROW mysqlrow; 


int res; 
char qs[250]; 
char is[250]; 
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char es[250]; 
int artist id = -17 


/* Does it already exist? */ 
mysql escape string(es, artist, strlen(artist]]; 
sprintf(qs, "SELECT id FROM artist WHERE name = '$s'*, es); 


res = mysql query(&my connection, qs); 
if (res) ( 
fprintf(stderr, "SELECT error: $sin*, mysql error(&my connection)]; 
) else ( 
res ptr - mysql store result(&my connection); 
if (res ptr) ( 
if (mysql num rows(res ptr) » 0) ( 
if (mysqlrow - mysql fetch row(res ptr)) ( 
sscanf(mysqlrow[0], "*d*, &artist id); 
) 
) 
mysql free result (res ptr); 
) 
) 
if (artist id 





-1) return artist id; 





sprintf(is, "INSERT INTO artist(name) VALUES('$s')*, es); 
res = mysql query(&my connection, is]; 
if (res) ( 
fprintf(stderr, "Insert error $d: $sin", 
mysql.errno(&my connection), mysql error(&my connection]]; 
return 0; 
) 
res = mysql query(&my connection, "SELECT LAST INSERT ID(])*); 
if (res) ( 
printf('SELECT error: $s Wn", mysql error(&my connection)]; 
return 0; 
) else { 
res ptr = mysql use result (&my connection); 
if (res ptr) ( 
if ((mysqlrow = mysql fetch row(res ptr])) ( 
sscanf(mysqlrow[0], "$d', &artist id); 
) 
mysql free resultires ptr); 
) 
) 
return artist id; 
) /* get artist id */ 


现在 ， 继 续 添加 CD 的 曲目 信息 。 你 仍然 需要 保护 曲目 标题 中 的 特殊 字符 : 


int add tracks(struct current tracks st *tracks) ( 


int res; 
char is(250]; 
char es[250]; 
int i; 
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if (!dbconnected) return 0; 


i-0; 
while (tracks-»track[i][0]) ( 
mysql escape string(es, tracks-»track[i], strlen(tracks-»track[i])); 
sprintf (is, "INSERT INTO track(cd id, track id, title) 
VALUES($d, &d, '$s')", tracks-»cd id, i + 1, es); 
res = mysql query(&my connection, is]; 
if (res) ( 
fprintf(stderr, "Insert error $d: $sWn', 
mysql errno(&my connection), mysql error(&my connection)]; 
return 0; 
) 
ien 
) 
return 1; 
) /* add tracks */ 


现在 ， 根 据 给 定 的 CD 的 ID 值 来 提取 CD 信息 。 你 将 使 用 一 个 数据 库 联合 在 提取 CD 信息 的 同时 提 
取 艺 术 家 的 ID。 这 是 很 好 的 练习 : 数据 库 擅长 于 了 解 如 何 高 效 地 执行 复杂 查询 ， 所 以 如 果 一 个 任务 
可 以 仅仅 通过 SQL 语句 就 能 让 数据 库 来 完成 , 就 决 不 要 自己 来 编写 程序 代码 。 这样 不 仅 可 以 节省 自己 
的 精力 ， 不 必 编 写 额外 的 代码 ， 而 且 通 过 让 数据 库 尽 可 能 多 地 完成 复杂 工作 ， 也 可 以 提高 程序 的 执 
行 效率 。 

int get cd(int cd id 


MYSQL RES *res pt 
MYSQL ROW mysqlrow: 


struct current cd st *dest) ( 






int res; 
char qs[250]; 


if (!dbconnected) return 0; 
memset(dest, 0, sizeof(*dest]); 
dest-»artist id - -1; 


sprintf(qs, "SELECT artist.id, cd.id, artist.name, cd.title, cd.catalogue \ 
FROM artist, cd WHERE artist.id = cd.artist id and cd.id = èd", cd id); 


res = mysql query(&my connection, qs); 
if (res) ( 
fprintf (stderr, "SELECT error: %s\n", mysql error(&my connection]); 
) else ( 
res ptr - mysql store result(&my connection); 
if (res ptr) ( 
if (mysql num rows(res ptr) > 0) { 
if (mysqlrow = mysql fetch row(res ptr])) ( 
sscanf(mysqlrow[0], "td*, &dest-»artist id); 
sscanf(mysqlrow[1], "td', &dest-»cd id); 
strcpy(dest-»artist name, mysglrowi2]]; 
strcpyldest-»title, mysglrow[3]); 
strcpy(dest-»catalogue, mysqlrow[4]); 


) 
mysql free result(res ptr]; 
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) 
} 
if (dest->artist_id != -1) return 1; 
return 0; 
} /* get cd */ 


接 下 来 ， 你 要 实现 曲目 信息 的 提取 。 注 意 ， 你 通过 SQL 语句 中 指定 一 个 ORDER BY 子 句 来 确保 曲目 
以 一 个 有 意义 的 顺序 返回 。 而 且 ， 由 数据 库 来 完成 这 些 工 作 将 比 我 们 以 任意 顺序 提取 数据 ， 并 自己 编 
写 代码 来 排序 更 有 效率 。 


int get cd tracks(int cd id, struct current tracks st *dest) { 
MYSQL RES *res ptr; 
MYSQL ROW mysqlrow; 


int res; 
char qs[250]; 
int i - 0, num tracks = 0; 


if (!dbconnected) return 0; 
memset(dest, 0, sizeof(*dest)); 
dest-»cd id - -1; 


sprintf(qs, "SELECT track id, title FROM track WHERE track.cd id = $d V 
ORDER BY track id', cd id); 


res = mysql query(&my connection, qs]; 
if (res) ( 
fprintf(stderr, "SELECT error: %s\n", mysql error(&my connection)); 
else ( 
res ptr = mysql store result(&my connection); 
if (res ptr) ( 
if ((num tracks = mysql num rows(res ptr]) > 0) ( 
while (mysqlrow = mysql fetch row(res ptr)) ( 
strcpy(dest-»track[i], mysqlrow[1]); 
ien 
} 
dest-»cd id = cd id; 
) 
mysql free result(res ptr); 
) 


) 
return num tracks; 
) /* get. cd tracks */ 


至 此 ， 你 已 添加 并 提取 了 CD 的 相关 信息 ， 现 在 是 时 候 搜索 CD 了 。 你 通过 限制 返回 结果 的 数目 来 
保持 接口 的 简单 ， 但 是 你 仍然 想 让 函数 告诉 你 共有 多 少 行 ， 即 使 这 多 于 你 能 够 提取 的 结果 数 。 
int find cds(char *search str, struct cd search st *dest) ( 
MYSQL RES *res ptr; 
MYSQL ROW mysqlrow; 


int res; 
char qs[500]; 
int i = 0; 

char ss(250]; 
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int num rows = 0; 


if (!dbconnected) return 0; 


现在 ， 清 空 结果 结构 并 保护 查询 字符 串 中 的 特殊 字符 : 


memset(dest, -1, sizeof(*dest)); 
mysql escape string(ss, search str, strlen([search str)); 


接着 ， 你 构造 一 个 查询 字符 串 。 注 意 它 需要 使 用 相当 多 的 $ 字 符 ， 因 为 % 既 是 SQL 语句 中 用 来 匹 本 
任何 字符 串 的 字符 ， 也 是 sprintf 中 的 一 个 特殊 字符 。 
sprintf (qs, "SELECT DISTINCT artist.id, cd.id FROM artist, cd WHERE artist.id = 


cd.artist id and (artist.name LIKE '%%%s%%' OR cd.title LIKE '$$$s$$' OR 
Cd.catalogue LIKE '%%%s%%')", ss, ss, ss); 


现在 ， 你 可 以 执行 查询 了 : 


res = mysql_query (&my_connection, qs]; 


if (res) { 

fprintf(stderr, "SELECT error: %s\n", mysql_error (&my_connection) ); 
) else ( 

res ptr = mysql store result(&my connection); 

if (res ptr) ( 


num rows - mysql num rows(res ptr); 
if ( num rows » 0) ( 
while ((mysqlrow = mysql fetch row(res ptr)) && i < MAX CD RESULT) ( 
sscanf(mysqlrow[1], "&d*, &dest-»cd id[i]); 
ien 
) 
) 
mysql free result(res ptr); 
) 
) 
return num rows; 
) /* find cds */ 


dic, VoRESEHUMIRCD( E. 29 T VEG BUTISAUUIETERE POR SC HL NR, RICD, 
如 果 没 有 其 他 CD 包含 同一 个 艺术 家 字符 串 ， 你 将 删除 这 张 CD 对 应 的 艺术 家 。 奇 怪 的 是 ，SQL 没 有 一 
次 从 多 个 表 中 删除 数据 的 方法 ， 所 以 你 必须 依次 从 每 个 表 中 删除 数据 。 


int delete cd(int cd id) ( 


int res; 

char qs[250]; 

int artist id, num rows; 
MYSQL RES *res ptr; 
MYSQL ROW mysglrow; 


if (!dbconnected) return 0; 


artist id - -1; 
sprintf(qs, "SELECT artist id FROM cd WHERE artist id = 
(SELECT artist id FROM cd WHERE id = '$d')', cd id): 
res - mysql query(&my connection, qs); 
if (res) { 
fprintf (stderr, "SELECT error: $sin', mysql error(&my connection)); 
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) else ( 
res ptr = mysql store result(&my connection); 


if (res ptr) { 
num rows - mysql num rows(res ptr); 
if (num rows 1) t 
/* Artist not used by any other CDs */ 
mysqlrow = mysql fetch row(res ptr); 
sscanf(mysqlrow[0], "$d*, &artist id); 








) 
mysql free result(res ptr); 
) 
) 
sprintf(qs, "DELETE FROM track WHERE cd id = '$&d'", cd id); 
res = mysql query(&my.connection, qs); 


if (res) ( 
fprintf(stderr, "Delete error (track) &d: $sin*, 


mysql errno(&my connection), mysql error(&my connection]]; 
return 0; 


) 


sprintf (qs, "DELETE FROM cd WHERE id = '&d'", cd id); 
res = mysql query(&my connection, qs]; 
if (res) ( 
fprintf(stderr, "Delete error (cd) %d: s\n", 
mysql errno(&my connection), mysql error(&my connection)); 
return 0; 
) 





if (artist id != -1) ( 
/* artist entry is now unrelated to any CDs, delete it */ 
sprintf(qs, "DELETE FROM artist WHERE id = '$d'", artist id); 
res = mysql query(&my connection, qs); 


if (res) ( 
fprintf(stderr, "Delete error (artist) %d: $sin', 


mysql errno(&my connection), mysql error(&my connection)); 


) 
) 


return 1; 


) /* delete cd */ 


这 完成 了 所 有 的 代码 。 


考虑 到 完整 性 ， 我 们 添加 一 个 makefile 文 件 来 使 你 的 工作 更 为 轻松 。 你 可 能 需要 根据 MySQL 安 
装 的 情况 来 调整 incluGe 路 径 。 
all: app a 


app: appomysql.c app test.c app mysql.h 
gcc -o app -I/usr/include/mysql app mysql.c app test.c 
-imysglclient -L/usr/lib/mysql 


在 后 面 的 章节 中 ， 你 将 看 到 这 个 接口 被 用 于 真正 的 GUI。 至 于 现在 ， 如 果 你 想 观察 执行 代码 所 引 
起 的 数据 库 改变 ， 我 们 建议 你 在 一 个 窗口 中 运行 sab 调 试 器 来 单 步 运行 代码 ， 同 时 在 另 一 个 窗口 中 观 
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察 数据 库 数据 的 变化 ,如 果 使 用 MySQL 查 询 浏览 器 , 请 记 住 你 需要 刷新 数据 显示 才能 看 到 数据 的 变化 。 
8.5 小 结 


在 本 章 中 ,我们 简要 介绍 了 MySQL。 对 于 经 验 丰富 的 使 用 者 来 说 ， 他 们 将 发 现 许 多 我 们 没有 时 间 
在 本 章 中 讨论 的 高 级 功能 ， 如 外 键 约束 和 触发 器 。 

你 学 习 了 安装 MySQL 的 基础 知识 ， 并 掌握 了 如 何 通过 客户 端 工具 对 MySQL 数 据 库 进行 基本 的 管 
理 。 我 们 介绍 了 它 的 C 语 言 API 接 口 ， 这 是 能 与 MySQL 一 起 工作 的 编程 语言 之 一 。 在 此 过 程 中 ， 你 还 
学 习 了 一 些 SQL 语句 。 

我 们 希望 本 章 能 够 鼓励 你 开始 尝试 使 用 一 个 基于 SQL 的 数据 库 来 处 理 数据 ， 并 能 继续 学 习 以 了 解 
这 些 强大 的 数据 库 管 理工 具 的 更 多 功能 。 

友情 提示 ，MySQL 的 更 多 信息 可 参见 MySQL 主 页 www.mysql.com。 
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开发 工具 


本 章 中 ， 我 们 将 介绍 一 些 Linux 系 统 中 的 程序 开发 工具 ， 其 中 一 些 工具 也 可 以 在 UNIX 系 统 
E 中 使 用 。 Linux 系 统 除 提供 开发 人 员 必 需 的 编译 器 和 调试 器 外 ， 供 一 组 工具 ， 其 中 每 个 
都 可 以 完成 一 件 独立 的 任务 ， 并 且 人 允许 开发 人 员 将 它们 创造 性 地 组 合 在 一 起 ， 而 这 种 组 合 能 力也 是 
Linux 从 UNIX 的 哲学 体系 中 继承 而 来 的 。 你 将 在 本 章 中 看 到 一 些 非常 重要 的 开发 工具 ， 并 将 利用 这 些 
工具 解决 一 些 实际 问题 。 这 些 工具 包括 : 
口 make 命 令 和 makefile 文 件 
口 使 用 RCS 和 CVS 系 统 对 源 代码 进行 控制 
口 编写 手册 页 
口 使 用 patch 和 tar 命 令 来 发 布 软件 
口 开发 环境 
9.1 多 个 源 文件 带 来 的 问题 
在 编写 小 程序 时 ， 许 多 人 都 会 在 编辑 完 源 文件 后 重新 编译 所 有 文件 来 重建 应 用 程序 。 但 对 大 型 程 
序 来 说 ， 使 用 这 种 简单 的 处 理 方式 会 带 来 一 些 很 明显 的 问题 。 编 辑 一 编译 一 测试 这 一 循环 的 周期 将 变 
长 。 如 果 仅 改动 了 一 个 源 文 件 ， 即 使 是 最 有 耐心 的 程序 员 也 不 想 重新 编译 所 有 的 源 文 件 。 
如 果 在 程序 中 创建 了 多 个 头 文件 ， 并 司 的 源 文件 中 包含 它们 ， 这 种 处 理 方式 就 会 带 来 一 个 潜 
在 的 、 更 严重 的 问题 。 比 如 说 ， 你 有 3 个 头 文件 ， a.h、b.h 和 c.h，3 个 C 源 文件 main.c、2.c 和 3.c (我 
们 希望 读者 在 实际 的 项 目 中 为 源 文件 选择 更 好 的 名 字 )， 具 体 的 情况 如 下 所 示 : 


/* main.c */ 
#include "a.h" 












1592.6 97 
include *a.h" 
finclude "b.h* 


judo 
#include *b.h" 
include "c.h* 


如 果 程 序 员 只 修改 了 头 文件 ch, 则 源 文件 main .c 和 2 .c 无 需 重新 编译 ,因为 它们 并 不 依赖 于 这 个 
头 文件 ， 而 对 于 源 文件 3 .c 来 说 ， 因 为 它 包含 了 头 文件 c.h， 所 以 在 头 文件 c.h 改 动 后 ， 就 必须 重新 纺 国 
译 它 。 但 如 果 修 改 的 是 头 文件 b.h， 而 程序 员 又 忘记 重新 编译 源 文件 2.c， 则 最 终 的 程序 就 可 能 无 法 正 
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常 工作 了 。 
make 工 具 可 以 解决 上 述 这 些 问题 ， 它 会 在 必要 时 重新 编译 所 有 受 改动 影响 的 源 文 件 。 
make 命 令 不 仅仅 用 于 编译 程序 ,无 论 何 时 , 当 需 要 通过 多 个 输入 文件 来 生成 输出 文件 时 ， 
你 都 可 以 利用 它 来 完成 任务 。 它 的 其 他 用 法 还 包括 文档 处 理 ( 例如 针对 troff 或 Tex 文 档 ). 


9.2 make 命令 和 makefile 文件 


你 将 看 到 ,虽然 make 命 令 内 置 了 很 多 智能 机 制 ,但 光 任 其 自身 是 无 法 了 解 应 该 如 何 建 立 应 用 程序 
的 。 你 必须 为 其 提供 一 个 文件 ， 告 诉 它 应 用 程序 应 该 如 何 构造 ， 这 个 文件 称 为 makefile。 

makefile 文 件 一 般 都 会 和 项 目的 其 他 源 文件 放 在 同一 目录 下 .你 的 机 器 上 可 以 同时 存在 许多 不 同 
的 makefile 文 件 。 事 实 上 ， 如 果 管理 的 是 一 个 大 项 目 ， 你 可 以 用 多 个 不 同 的 makefile 文 件 来 分 别管 
理 项 目的 不 同 部 分 。 

make 命 令 和 makefile 文 件 的 结合 提供 了 一 个 在 项 目 管理 领域 十 分 强大 的 工具 。 它 不 仅 常 被 用 于 
控制 源 代码 的 编译 ， 而 且 还 用 于 手册 页 的 编写 以 及 将 应 用 程序 安装 到 目标 目录 。 

9.2.1 makefile 的 语法 

makefile 文 件 由 一 组 依赖 关系 和 规则 构成 。 每 个 依赖 关系 由 一 个 目标 (即将 要 创建 的 文件 ) 和 一 
组 该 目标 所 依赖 的 源 文件 组 成 。 而 规则 描述 了 如 何 通过 这 些 依赖 文件 创建 目标 。 一 般 来 说 ， 目 标 是 
个 单独 的 可 执行 文件 。 

make 命 令 会 读 取 makefile 文 件 的 内 容 ， 它 先 确定 目标 文件 或 要 创建 的 文件 ， 然 后 比较 该 目标 所 
依赖 的 源 文件 的 日 期 和 时 间 以 决定 该 采用 哪 条 规则 来 构造 目标 。 通 常 在 创建 最 终 的 目标 文件 之 前 ， 
它 需 要 先 创建 一 些 中 间 目 标 。make 命 令 会 根据 makefile 文 件 来 确定 目标 文件 的 创建 顺序 以 及 正确 的 
规则 调用 顺序 。 

9.22 make 命令 的 选项 和 参数 

make 程 序 本 身 有 许多 选项 ， 其 中 最 常用 的 3 个 选项 如 下 所 示 。 

O -k: 它 的 作用 是 让 make 命 令 在 发 现 错误 时 仍然 继续 执行 ， 而 不 是 在 检测 到 第 一 个 错误 时 就 售 
下 来 。 你 可 以 利用 这 个 选项 在 一 次 操作 中 发 现 所 有 未 编译 成 功 的 源 文件 。 

O -n: 它 的 作用 是 让 make 命 令 输出 将 要 执行 的 操作 步骤 ， 而 不 真正 执行 这 些 操作 。 

O -f «filename»: 它 的 作用 是 告诉 make 命 令 将 哪个 文件 作为 makefile 文 件 。 如 果 未 使 用 这 个 
选项 ， 标 准 版 本 的 make 命 令 将 首先 在 当前 目录 下 查找 名 为 makefile 的 文件 ， 如 果 该 文件 不 存 
在 , 它 就 会 查找 名 为 Makefile 的 文件 .但 如 果 你 是 在 Linux 系 统 中 , 你 使 用 的 可 能 是 GNU Make, 
这 个 版 本 的 make 命 令 将 在 搜索 makefile 文 件 和 Makefile 文 件 之 前 ， 首 先 查找 名 为 
GNUmakefile 的 文件 。 按 惯例 ， 许 多 Linux 程 序 员 使 用 文件 名 Makefile， 因 为 如 果 一 个 目录 下 
都 是 以 小 写字 母 为 名 称 的 文件 ， 则 wakefile 文 件 将 在 目录 的 文件 列表 中 第 一 个 出 现 。 我 们 建 
议 不 要 使 用 文件 名 GNUmakefile， 因 为 它 是 特定 于 make 命 令 的 GNU 实 现 的 。 

为 了 指示 make 命 令 创建 一 个 特定 的 目标 〈 通 常 是 一 个 可 执行 文件 )， 你 可 以 把 该 目标 的 名 字 作为 
make 命 令 的 一 个 参数 。 如 果 不 这 么 做 ，make 命 令 将 试图 创建 列 在 makefile 文 件 中 的 第 一 个 目标 。 许 
多 程序 员 都 会 在 自己 的 makefile 文 件 中 将 第 一 个 目标 定义 为 a11， 然 后 再 列 出 其 他 从 属 目标 。 这 个 约 
定 可 以 明确 地 告诉 make 命 令 ， 在 未 指定 特定 目标 时 ,默认 情况 下 应 该 创建 哪个 目标 。 我 们 建议 读者 都 
坚持 使 用 这 一 约定 。 
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1. 依赖 关系 

依赖 关系 定义 了 最 终 应 用 程序 里 的 每 个 文件 与 源 文件 之 间 的 关系 。 在 本 章 前 面 的 程序 示例 中 ， 你 
可 以 把 依赖 关系 定义 为 最 终 应 用 程序 依赖 于 文件 main.o、2.o 和 3.o。 同 样 ，main.o 依 赖 于 main.c 和 
a.h，2.o 依 赖 于 2.c、a.h 和 b.h，3.o 依 赖 于 3.c、b.h 和 c.h。 因 此 ，main.o 受 文件 main.c 和 a.h 修 
改 的 影响 ， 如 果 这 两 个 文件 之 一 有 所 改变 ， 你 就 需要 重新 编译 main .c 来 重建 main.o。 

在 makefile 文 件 中 ， 这些 规则 的 写法 是 : 先 写 目标 的 名 称 ， 然 后 紧 跟着 一 个 冒号 ， 接 着 是 空格 或 
制 表 符 tab， 最 后 是 用 空格 或 制 表 符 tab 隔 开 的 文件 列表 〈 这 些 文件 用 于 创建 目标 文件 )。 与 前 面 例子 相 
对 应 的 依赖 关系 列表 如 下 所 示 : 

myapp: main.o 2.0 3.0 

main.o: main.c a.h 

2.0: 2.c a.h b.h 

3.0: 3.c bih c.h 

它 表 示 目 标 myapp 依 赖 于 main.o、2.o 和 3.o， 而 main.o 依 赖 于 main.c 和 a.h， 等 等 。 

这 组 依赖 关系 形成 一 个 层次 结构 ， 它 显示 了 源 文件 之 间 的 关系 。 你 可 以 很 容易 地 看 出 ， 如 果 文 件 
b.h 发 生 改 变 , 你 就 需 重新 编译 2.o 和 3 .o, 而 由 于 2.o 和 3.o 发 生 了 改变 , 你 还 需要 重新 创建 目标 myapp。 

如 果 想 一 次 创建 多 个 文件 ,你 可 以 利用 伪 目 标 all。 假设 应 用 程序 由 二 进 制 文件 ryapp 和 使 用 手册 
myapp.1 组 成 。 你 可 以 用 下 面 这 行 语句 进行 定义 : 

all: myapp myapp.1 

这 里 再 次 强调 ， 如 果 未 指定 一 个 al 1 目标 ， 则 maxe 命 令 将 只 创建 它 在 文件 nakefile 中 找到 的 第 一 
个 目标 。 

2. 规则 

makefile 文 件 的 第 二 部 分 内 容 是 规则 ， 它 们 定义 了 目标 的 创建 方式 。 在 上 节 的 例子 中 ， 当 make 
命令 确定 需要 重建 2.o 时 ， 它 具体 应 该 使 用 哪 条 命令 昵 ? 看 上 去 只 需 使 用 命令 gcc -c 2.c 就 够 了 (在 
后 面 你 将 看 到 ，make 命 令 内 置 了 很 多 默认 规则 )， 但 如 果 需 要 指定 头 文件 目录 ， 或 者 为 了 今后 的 调试 
需要 设置 符号 信息 选项 又 该 怎么 做 呢 ? 这 就 需要 在 makefile 文 件 中 明确 定义 一 些 规则 。 

此 时 ,我们 必须 提 及 makefile 文 件 中 一 个 非常 奇怪 而 又 令 人 遗 幅 的 语法 现象 : 空格 和 制 

表 符 tab 是 有 区 别 的 .规则 所 在 的 行 必须 以 制 表 符 lab 开头， 用 空格 是 不 行 的 。 由 于 连续 几 个 

空格 和 一 个 制 表 符 tab 看 上 去 很 相似 ， 而 且 几乎 在 Linux 编 程 的 所 有 领域 中 ， 空 格 和 制 表 符 tab 

之 间 几 乎 没有 差别 ， 所 以 这 样 的 语法 规定 会 带 来 问题 此外， 如 果 makefile 文 件 中 的 某 行 以 

空格 结尾 ， 它 也 可 能 会 导致 make 命 令 执 行 失败 。 但 这 些 都 是 历史 遗留 问题 ， 而 且 因为 已 有 太 

多 的 makefile 文 件 存在 ， 企 图 将 其 全 部 改正 是 不 现实 的 ， 所 以 请 小 心 编写 makefile 文 件 。 

幸运 的 是 ， 如 果 缺 少 了 制 表 符 tab，make 命 令 就 不 会 正常 工作 ， 所 以 发 现 这 个 错误 很 容易 。 


xE 一 个 简单 的 makefile 文 件 


大 多 数 规则 都 包含 一 个 简单 的 命令 ， 该 命令 也 可 以 在 命令 行 上 执行 。 就 前 面 的 例子 来 说 ， 你 把 创 
建 的 第 一 个 makefile 文 件 命名 为 Makefilel: 


myapp: main.o 2.0 3.0 
gcc -o myapp main.o 2.0 3.0 
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main.o: main.c a.h 
gcc -c main.c 


2:0: 2.c a.h b.h 
gec -e 2.c 


3.0: 3.c b.h c.h 
gce -c 3.c 
你 在 调用 make 命 令 时 加 上 -f 选 项 , 这 是 因为 makefile 文 件 并 未 使 用 常见 的 默认 文件 名 makefile 
或 wakefile。 如 果 在 一 个 没有 任何 源 文件 的 目录 下 执行 这 个 命令 ， 你 就 会 得 到 如 下 的 输出 结果 : 


$ make -f Makefilel 
make: *** No rule to make target 'main.c', needed by 'main.o'. Stop. 
$ 


make 命 令 假设 在 makefile 文 件 中 的 第 一 个 目标 myapp 是 想 创建 的 目标 文件 . 然后 它 会 检查 其 他 的 
依赖 关系 ， 并 确定 需要 有 一 个 名 为 main.c 的 文件 。 由 于 并 未 创建 该 文件 ，makefile 文 件 里 也 未 说 明 
如 何 创建 该 文件 ， 所 以 make 命 令 报 告 一 个 错误 。 下 面 就 来 创建 这 些 源 文件 并 重新 进行 尝试 。 由 于 对 程 
序 执行 的 结果 没有 兴趣 , 所 以 这 些 文件 的 内 容 都 非常 简单 。 头 文件 实际 上 都 是 空 文件 , 你 可 以 用 touch 
命令 来 创建 它们 : 

$ touch a.h 


$ touch b.h 
$ touch c.h 


源 文件 main.c 中 包 仿 main 函数 , 该 函数 调用 了 function_two 和 function_three 函 数 , 而 这 两 个 
函数 分 别 在 另外 两 个 文件 中 定义 。 源 文件 通过 #incluae 语 句 包含 合适 的 头 文件 , 使 它们 看 上 去 依赖 于 
这 些 头 文件 的 内 容 。 它 其 实 算 不 上 是 一 个 应 用 程序 ， 下 面 是 其 程序 清单 : 

/* main.c */ 

Winclude <stdlib.h> 

include *a.h* 





extern void function two(); 
extern void function three(); 


int main() 


function two(); 

function three(); 

exit (EXIT SUCCESS); 
) 


2338: ey 
include "a.h" 
#include "b.h* 


void function two() ( 
} 


ea/ 
#include "b.h" 
#include "c.h* 
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void function three() ( 
$ 


再 次 执行 make 命 令 : 

$ make -f Makefilel 

gcc -c main.c 

gec -c 2.c 

gcc -c 3.c 

gcc -o myapp main.o 2.0 3.0 

$ 

这 次 成 功 执行 了 make 命 令 。 

实验 解析 

make 命 令 处 理 makefile 文 件 中 定义 的 依赖 关系 ， 确 定 需 要 创建 的 文件 以 及 创建 顺序 。 虽 然 把 如 
何 创建 目标 myapp 列 在 最 前 面 ， 但 make 命 令 能 够 自行 判断 出 创建 文件 的 正确 顺序 。 它 调用 你 在 规则 部 
分 给 出 的 命令 来 创建 相应 的 文件 ， 同 时 会 在 执行 时 在 屏幕 上 将 命令 显示 出 来 。 现 在 ， 你 可 以 测试 在 文 
件 b.h 改 变 时 ，makefile 文 件 能 否 正确 处 理 这 一 情况 : 

$ touch b.h 

$ make -f Makefilel 

gcc -c 2.c 

gcc -c 3.c 

gcc -o myapp main.o 2.0 3.0 


make 命 令 读 取 makefile 文 件 ， 确 定 重建 myapp 所 需 的 最 少 命 令 ， 并 以 正确 的 顺序 执行 它们 。 下 面 
我 们 来 看 ， 如 果 删 除 一 个 目标 文件 会 发 生 什么 情况 : 

$ rm 2.0 

$ make -f Makefilel 

gcc -c 2.c 

gcc -o myapp main.o 2.0 3.0 


$ 
make 命 令 再 次 正确 地 确定 出 需要 采取 的 动作 。 





9.2.3 makefile 文件 中 的 注释 


makefile 文 件 中 的 注释 以 # 号 开头 ， 一 直 延 续 到 这 一 行 的 结束 。 和 C 语 言 源 文 件 中 的 注释 一 样 ， 
makefile 文 件 中 的 注释 可 以 帮助 程序 的 编写 者 及 其 他 人 理解 最 初 编写 这 个 文件 的 目的 。 


9.2.4 makefile 文件 中 的 宏 


即使 上 述 内 容 就 是 make 命 令 和 makefile 文 件 的 全 部 ， 对 于 管理 包含 多 个 源 文件 的 项 目 来 说 ， 它 
们 仍然 是 强 有 力 的 工具 。 但 是 ， 对 于 管理 包含 非常 多 源 文件 的 大 型 项 目 来 说 ， 它 们 就 显得 过 于 庞大 并 
缺乏 弹性 。 因 此 ，makefile 文 件 允许 你 使 用 宏 以 一 种 更 通用 的 格式 来 书写 它们 。 

你 通过 语句 MACRONAME=value 在 makefile 文 件 中 定义 宏 ， 引 用 宏 的 方法 是 使 用 $ (MACRONAME) 或 
${MACRONAME)。make 的 某 些 版 本 还 接受 $MACRONAME 的 用 法 。 如 果 想 把 一 个 宏 的 值 设置 为 宅 ， 你 可 以 
令 等 号 (=) fni BI. 

makefile 文 件 中 的 宏 常 被 用 于 设置 编译 器 的 选项 。 在 软件 的 开发 过 程 中 , 通常 开发 人 员 不 会 对 编 
译 结果 进行 优化 ， 而 是 将 调试 信息 包含 进去 。 但 对 于 软件 的 发 行 版 ， 往 往 又 需 反 过 来 做 ， 即 编译 结果 
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是 一 个 不 包含 调试 信息 的 容量 较 小 的 二 进 制 可 执行 文件 ， 使 其 执行 速度 尽 可 能 快 。 

Makefilel 文 件 的 另 一 问题 是 ， 它 假设 编译 器 的 名 字 是 gcc， 而 在 其 他 UNIX 系 统 中 ， 编 译 器 的 名 
字 可 能 是 cc 或 c89。 如 果 想 将 makefile 文 件 移植 到 另 一 版 本 的 UNIX 系 统 中 ， 或 在 现 有 系统 中 使 用 另 
一 个 编译 器 ,为 了 使 其 工作 ， 你 将 不 得 不 修改 makefile 文 件 中 许多 行 的 内 容 。 宏 是 用 来 收集 所 有 这 些 
与 系统 相关 内 容 的 好 方法 ， 通 过 使 用 宏 定义 ， 你 可 以 方便 地 修改 这 些 内 容 。 

宏 通常 都 是 在 makefile 文 件 中 定义 的 ， 但 你 也 可 以 在 调用 make 命 令 时 在 命令 行 上 给 出 宏 定义 ， 
例如 命令 make cc=c89。 命 令 行 上 的 宏 定义 将 覆盖 在 makefile 文 件 中 的 宏 定义 。 当 在 makefile 文 件 
之 外 使 用 宏 定义 时 ， 要 注意 宏 定义 必须 以 单个 参数 的 形式 传递 ， 所 以 应 避免 在 宏 定 义 中 使 用 空格 或 应 
像 下 面 这 样 给 宏 定义 加 上 引号 ;make "CC = c89"。 


实验 (ES 带 宏 定义 的 makefile 文 件 


下 面 是 makefile 文 件 的 一 个 修订 版 本 Makefile2， 它 使 用 了 一 些 宏 定义 : 
all: myapp 











# Which compiler 
CC = gcc 


# Where are include files kept 
INCLUDE = . 


# Options for development 
CFLAGS = -g -Wall -ansi 


* Options for release 
* CFLAGS - -O -Wall -ansi 


myapp: main.o 2.0 3.0 
$(CC) -o myapp main.o 2.0 3.0 


main.o: main.c a.h 
$(CC) -IS(INCLUDE) $(CFLAGS) -c main.c 


2.0: 2.c a.h b.h 
$(CC) -IS(INCLUDE) $(CFLAGS) -c 2.c 


3.0: 3.c b.h c.h 
$(CC) -IS(INCLUDE) $(CFLAGS) -c 3.c 


出 除 旧 的 安装 文件 ， 并 通过 这 个 新 的 makefile 文 件 创建 新 的 安装 文件 ， 你 将 看 到 如 下 的 输出 ; 
$ rm *.o myapp 

$ make -f Makefile2 

gcc -I. -g -Wall -ansi -c main.c 

gcc -I. -g -Wall -ansi -c 2.c 

gcc -I. -g -Wall -ansi -c 3.c 

gcc -o myapp main.o 2.0 3.0 

$ 


make 命 令 将 $ (CC) 、$ (CFLAGS) ls (INCLUDE) 替换 为 相应 的 宏 定 义 , 这 与 C 语 言 编译 器 对 #define 
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语句 的 处 理 方式 很 相似 。 现 在 ， 如 果 想 改变 编译 器 命令 ， 你 只 需 修改 makefile 文 件 中 的 一 行 即 可 。 
事实 上 ，make 命 令 内 置 了 一 些 特殊 的 宏 定义 ， 通 过 使 用 它们 ， 你 可 以 让 makefile 文 件 变 得 更 加 

简洁 。 我 们 将 几 个 较 常 用 的 宏 列 在 表 9-1 中 ,其 使 用 方法 可 以 在 后 面 的 示例 中 看 到 。 这 些 宏 在 使 用 前 才 

展开 ， 所 以 它们 的 含义 会 随 着 makefile 文 件 的 处 理 进展 而 发 生变 化 。 事 实 上 ， 如 果 这 些 内 置 宏 的 用 














法 不 是 这 样 ， 它 们 就 没有 什么 用 处 了 。 
表 9-1 
t x 
s? 当前 目标 所 依赖 的 文件 列表 中 比 当前 目标 文件 还 要 新 的 文件 
$e 当前 目标 的 名 字 
lo 当前 依赖 文件 的 名 字 
se FESE M E (0 E AE F 


在 makefile 文 件 中 ， 你 可 能 还 会 看 到 下 面 两 个 有 用 的 特殊 字符 ， 它 们 出 现在 命令 之 前 。 

口 -: 告诉 make 命 令 忽 略 所 有 错误 。 例如， 如 果 想 创建 一 个 目录 ， 但 又 想 忽略 任何 错误 比如 目 
录 已 存在 )， 你 就 可 以 在 mkair 命 令 的 前 面 加 上 一 个 减 号 。 你 将 在 本 章 后 面 的 例子 中 看 到 符号 - 
的 应 用 。 

Oa: 告诉 make 在 执行 某 条 命令 前 不 要 将 该 命令 显示 在 标准 输出 上 。 如 果 想 用 echo 命 令 给 出 一 些 
说 明 信 息 ， 这 个 字符 将 非常 有 用 。 


9.2.5 多 个 目标 


通常 制作 不 止 一 个 目标 文件 或 者 将 多 组 命令 集中 到 一 个 位 置 来 执行 是 很 有 用 的 。 你 可 以 通过 扩展 
makefile 文 件 来 达到 这 一 目的 。 在 下 面 的 例子 中 , 你 在 makefile 文 件 中 增加 一 个 clean 选 项 来 删除 不 
需要 的 目标 文件 ， 增 加 一 个 install 选 项 来 将 编译 成 功 的 应 用 程序 安装 到 另 一 个 目录 下 。 


WU sTBÁ 


下 面 是 makefile 文 件 的 下 一 个 版 本 Makefile3 文 件 的 内 容 : 


all: myapp 





# Which compiler 
CC = gcc 


# Where to install 
INSTDIR = /usr/local/bin 


# Where are include files kept 
INCLUDE = . 


# Options for development 
CFLAGS - -g -Wall -ansi 


# Options for release 
# CFLAGS = -O -Wall -ansi 
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myapp: main.o 2.0 3.0 
$(CC) -o myapp main.o 2.0 3.0 


main.o: main.c a.h 
$(CC) -I$(INCLUDE) $(CFLAGS) -c main.c 


2.0: 2.c a.h b.h 
$(CC) -I$(INCLUDE) $(CFLAGS) -c 2.c 


3.0: 3.c b.h c.h 
$(CC) -I$(INCLUDE) $(CFLAGS) -c 3.c 


clean: 
-rm main.o 2.0 3.0 


install: myapp 
@if [ -d $(INSTDIR) ]; V 
then V 
cp myapp $(INSTDIR);V 
chmod a+x $(INSTDIR)/myapp; V 
chmod og-w $(INSTDIR)/myapp: V 
echo "Installed in $(INSTDIR)*;V 
else V 
echo "Sorry, $(INSTDIR) does not exist*;V 
fi 


这 个 makefile 文 件 中 有 几 处 需要 注意 。 首 先 ， 特 殊 目标 al1 仍 然 只 指定 了 myapp 这 一 个 目标 。 因 
此 ， 如 果 在 执行 make 命令 时 未 指定 目标 ， 它 的 默认 行为 就 是 创建 目标 myapp。 

下 一 个 值得 关注 之 处 就 是 两 个 新 增加 的 目标 : clean 和 install。 目 标 clean 用 rm 命令 来 删除 目标 
文件 。rm 命 令 以 减 号 -开头 ， 减 号 的 含义 是 让 make 命 令 忽略 rm 命令 的 执行 结果 ， 这 意味 着 ， 即 使 由 于 
目标 文件 不 存在 而 导致 rm 命令 返回 错误 ， 命 令 make clean 也 会 成 功 。 用 于 制作 目标 clean 的 规则 并 未 
给 目标 clean 定 义 任何 依赖 关系 ， 行 clean: 的 后 面 是 空 的， 因此 该 目标 总 被 认为 是 过 时 的 ， 所 以 在 执 
行 make 命 令 时 ， 如 果 指 定 目标 clean， 则 该 目标 所 对 应 的 规则 将 总 被 执行 。 

目标 install 依 赖 于 myapp， 所 以 make 命 令 知 道 它 必 须 首先 创建 myapp, 然后 才能 执行 制作 该 目标 
所 需 的 其 他 命令 。 用 于 制作 instal1l 目 标的 规则 由 儿 个 shell 脚 本 命令 组 成 。 由 于 make 命 令 在 执行 规则 
时 会 调用 一 个 shell， 并 且 会 针对 每 个 规则 使 用 一 个 新 shell， 所 以 必须 在 上 面 每 行 代码 的 结尾 加 上 一 个 
反 斜 杠 \, 让 所 有 shell 脚 本 命令 在 逻辑 上 处 于 同一 行 ， 并 作为 一 个 整体 传递 给 一 个 shell 执 行 。 这 个 命令 
以 符号 e 开 头 ， 表 示 make 在 执行 这 些 规则 之 前 不 会 在 标准 输出 上 显示 命令 本 身 。 

目标 instal1 按 顺序 执行 多 个 命令 将 应 用 程序 安装 到 其 最 终 位 置 。 它 并 没有 在 执行 下 一 个 命令 前 
检查 前 一 个 命令 的 执行 是 否 成 功 。 如 果 这 点 很 重要 ,你 可 以 将 这 些 命令 用 符号 && 连 接 起 来 , 如 下 所 示 : 

Qif [ -d $(INSTDIR) ]; V 
then V 
Cp myapp $(INSTDIR) &&V 
chmod a+x $(INSTDIR)/myapp && V 
chmod og-w $(INSTDIR/myapp && V 
echo "Installed in $(INSTDIR)* ;\ 
else V 


echo "Sorry, $(INSTDIR) does not exist" ; false ; V 
fi 





9.2 make 44-f» makefile X fk — 325 





大 家 应 该 记得 ， 我 们 曾经 在 第 2 章 见 过 该 符号 ， 对 shell 来 说 ， 它 是 “与 ”的 意思 ， 即 每 个 后 续 命 
令 只 在 前 面 的 命令 都 执行 成 功 的 前 提 下 才 会 被 执行 。 在 此 例 中 ， 你 并 不 过 分 关心 前 面 的 命令 是 否 执行 
成 功 ， 所 以 可 以 坚持 使 用 简单 的 格式 。 

你 可 能 不 能 以 普通 用 户 的 身份 将 新 命令 安装 到 目录 /usr/1local/bin 下 。 在 执行 命令 make 
instal1 之 前 ， 你 可 以 修改 makefile 文 件 以 选择 另 一 个 安装 目录 ， 或 是 改变 该 目录 的 权限 ， 或 是 通过 
命令 su 切换 用 户 身份 到 超级 用 户 root。 

$ rm *.o myapp 

$ make -f Makefile3 

gcc -I. -g -Wall -ansi -c main.c 

gcc g -Wall -ansi -c 2.c 

gcc g -Wall -ansi -c 3.c 

gcc -o myapp main.o 2.0 3.0 

$ make -f Makefile3 

make: Nothing to be done for 'all'. 

$ rm myapp 

$ make -f Makefile3 install 

gcc -o myapp main.o 2.0 3.0 

Installed in /usr/local/bin 

$ make -f Makefile3 clean 

rm main.o 2.0 3.0 

$ 


首先 ， 删 除 myapp 和 所 有 目标 文件 。 单 独 执行 make 命 令 的 话 ， 它 将 使 用 默认 目标 al1， 并 创建 可 
执行 程序 myapp。 然 后 再 次 运行 make 命 令 ， 但 因为 myapp 已 经 是 最 新 的 ， 所 以 make 命 令 未 做 任何 事 。 
接 下 来 ， 删 除 文件 myapp 并 执行 命令 make install， 它 重新 创建 二 进 制 文件 myapp 并 将 其 复制 到 安装 
目录 中 。 最 后 ， 运 行 命令 make clean 来 删除 当前 目录 下 所 有 的 目标 文件 。 













9.26 ”内 置 规则 


目前 为 止 ， 你 在 makefile 文 件 中 对 每 个 操作 步骤 的 执行 都 做 了 精确 的 说 明 。 事 实 上 ，make 命 令 
本 身 带 有 大 量 的 内 置 规 则 , 它们 可 以 极 大 地 简化 makefile 文 件 的 内 容 , 尤其 在 拥有 许多 源 文件 时 更 是 
如 此 。 为 测试 这 些 内 置 规则 ， 下 面 创建 文件 foo.c， 它 是 一 个 传统 的 “Hello World” 程 序 : 

#include <stdlib.h> 

#include <stdio.h> 

int main() 


printf(*Hello WorldWn"); 
exit(EXIT SUCCESS); 
) 
在 不 指定 makefile 文 件 时 ， 尝 试用 make 命 令 来 编译 它 : 


$ make foo 
ec foo.c -o foo 


$ 
可 以 看 到 ，make 命 令 知道 如 何 调用 编译 器 ， 虽 然 此 例 中 ， 它 选择 的 是 cc 而 不 是 ccc (在 Linux 系 统 
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中 ， 这 没有 问题 ， 因 为 cc 通常 是 gcc 的 一 个 连接 文件 )。 有 时 ， 这 些 内 置 规则 又 被 称 为 推导 规则 ， 由 于 
它们 都 会 使 用 宏 定义 ， 因 此 可 以 通过 给 宏 赋 予 新 值 来 改变 其 默认 行为 。 


$ rm foo 
$ make CCegcc CFLAGS="-Wall -g" foo 
gcc -Wall -g — foo.c -o foo 


$ 

你 可 以 通过 -p 选 项 让 make 命 令 打 印 出 其 所 有 内 置 规则 。 由 于 内 置 规则 实在 太 多 ,不 能 在 此 一 一 列 
出 ， 所 以 这 里 只 给 出 了 GNU 版 本 make 的 make -p 命 令 的 部 分 和 输出， 显示 了 其 中 一 部 分 的 规则 : 

OUTPUT OPTION = -o $6 

COMPILE.c = $(CC) S(CFLAGS) $(CPPFLAGS) $(TARGET ARCH) -c 

t.o: $. 

* pcm to execute (built-in): 

S(COMPILE.c) $(OUTPUT OPTION) $< 


考虑 到 存在 这 些 内 置 规则 ， 你 可 以 将 文件 nakefile 中 用 于 制作 目标 的 规则 去 掉 ， 而 只 需 指定 依赖 
关系 ， 从 而 达到 简化 makefile 文 件 的 目的 。 因 此 该 文件 中 相应 部 分 的 内 容 将 变 得 很 简单 ， 如 下 所 示 : 
main.o: main.c a.h 


2.0: 2.c a.h b.h 
3.0: 3,c b.h c.h 


读者 可 以 在 本 书 所 对 应 的 网 站 下 载 代码 中 找到 这 个 版 本 的 makefile 文 件 Makefile4。 
9.27 后缀 和 模式 规则 


你 看 到 的 内 置 规 则 在 使 用 时 都 利用 了 文件 的 后 缀 名 这 类 似 Windows 和 MS-DOS 的 文件 扩展 名 )， 
所 以 当 给 出 带 有 某 个 特定 后 缀 名 的 文件 时 , make 命 令 知 道 应 该 用 哪个 规则 来 创建 带 有 另 一 个 不 同 后 级 
名 的 文件 。 最 常见 的 一 条 规则 是 用 于 从 一 个 以 .c 为 后 组 名 的 文件 创建 出 一 个 以 .o 为 后 级 名 的 文件 。 该 
规则 使 用 编译 器 进行 编译 ， 但 并 不 对 源 文件 进行 链接 。 

有 时 ， 你 需要 自己 创建 新 规则 。 我 过 去 在 日 常 工作 中 经 常 需要 用 多 个 不 同 的 编译 器 对 源 文件 进行 
编译 ， 其 中 两 个 是 MS-DOS 下 的 编译 器 ， 一 个 是 Linux 下 的 gcc。 为 了 让 其 中 一 个 MS-DOS 编 译 器 能 够 
正常 工作 ， 源 文件 (它们 用 的 是 C++ 语 言 而 不 是 C 语 言 ) 需 要 以 .cpp 为 后 缀 名 。 但 糟糕 的 是 ， 那 个 时 
候 的 Linux 系 统 下 的 make 版 本 没有 用 于 编译 后 级 名 为 .cpp 的 源 文件 的 内 置 规则 ( 它 倒是 有 一 条 针对 .cc 
源 文件 的 规则 ，UNIX 系 统 中 的 C++ 文件 常 使 用 这 个 后 组 名 )。 

为 解决 这 个 问题 ， 或 者 为 每 个 单独 的 源 文件 指定 一 条 规则 ， 或 者 为 make 制 定 一 条 新 的 规则 ， 专 门 
用 于 从 后 组 名 为 .cpp 的 源 文 件 创建 目标 文件 。 假设 这 个 项 目 中 的 源 文件 数量 非常 大 ， 那 么 制定 一 条 新 
规则 将 节省 大 量 的 键入 时 间 ， 也 使 得 为 该 项 目 增加 新 的 源 文 件 变 得 更 加 容易 。 

要 想 增加 一 条 新 的 后 组 规则 ， 首 先 需要 在 makefile 文 件 中 增加 一 行 语句 ， 告 诉 make 命 令 这 个 新 
的 后 级 名 。 然 后 即 可 用 这 个 新 的 后 级 名 来 定义 规则 。make 使 用 特殊 语法 : 

-«old suffix».«new suffix»: 

来 定义 一 条 通用 规则 ， 利 用 该 规则 可 以 从 带 有 旧 后 组 名 的 文件 创建 带 有 新 后 组 名 的 文件 ， 并 保留 
原文 件 的 前 半 部 分 。 

下 面 是 makefile 文 件 的 一 个 片段 ， 它 用 一 个 新 的 通用 规则 将 .cpp 文件 编译 为 ,o 文 件 ; 

SUFFIXES: -cpp 


-Cpp.o: 
$(CC) -xce* $(CFLAGS) -IS(INCLUDE) -c $< 
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特殊 依赖 关系 .cpp.o: 告 诉 make， 紧 随 其 后 的 规则 是 用 于 将 后 组 名 为 .cpp 的 文件 转换 为 后 组 名 
为 .o 的 文件 。 在 定义 这 个 依赖 关系 时 ， 使 用 了 特殊 的 宏 名 称 ， 这 是 因为 此 时 你 还 不 知道 将 要 被 转换 的 
文件 的 名 字 。 要 想 理解 这 条 规则 ， 只 需要 记 住 宏 $< 将 被 扩展 为 起 始 文件 的 名 字 (包含 旧 的 后 缀 名 )。 
注意 ， 只 需 告诉 make 如 何 从 .cpp 文 件 得 到 .o 文 件 ，make 已 经 知道 如 何 从 一 个 目标 文件 得 到 一 个 二 进 
制 可 执行 文件 了 。 

当 调 用 make 命 令 时 ， 它 将 使 用 这 条 新 规则 从 bar . cpp 文件 得 到 bar .o 文 件 ， 然 后 再 使 用 它 的 内 置 
规则 从 .o 文 件 得 到 二 进 制 可 执行 文件 。-xc++ 标 志 的 作用 是 告诉 gcc 编 译 器 这 是 一 个 C++ 源 文件 。 

如 今 的 make 版 本 已 知道 如 何 处 理 后 组 名 为 .cpp 的 C++ 源 文件 了 , 但 当 需 要 将 一 种 类 型 的 文件 转换 
为 另 一 种 类 型 的 文件 时 ， 这 个 技术 仍然 很 有 用 。 

最 新 的 make 版 本 还 包含 一 个 新 的 语法 以 实现 同样 的 效果 ， 而 且 功 能 更 强大 。 例 如 ， 模 式 规则 可 以 
用 % 通 配 符 语法 来 匹配 文件 名 ， 而 不 是 仅 依赖 于 文件 的 后 缀 名 。 

可 以 达到 与 上 例 中 .cpp 规 则 同样 效果 的 模式 规则 如 下 所 示 : 


*.cpp: *o 
$(CC) -xc++ $(CFLAGS) -I$(INCLUDE) -c $< 


9.2.8 用 make 管理 函数 库 


对 于 大 型 项 目 ， 一 种 比较 方便 的 做 法 是 用 函数 库 来 管理 多 个 编译 产品 。 函 数 库 实 际 上 就 是 文件 ， 
它们 通常 以 .a〈a 是 英文 archive 的 首 字 母 ) 为 后 组 名 ， 在 该 文件 中 包含 了 一 组 目标 文件 。make 命 令 用 
-个 特殊 的 语法 来 处 理 函数 库 ， 这 使 得 函数 库 的 管理 工作 变 得 非常 容易 。 
用 于 管理 函数 库 的 语法 是 lib(file.o), 它 的 含义 是 目标 文件 file.o 是 存储 在 函数 库 1ib.a 中 的 。 
make 命 令 用 一 个 内 置 规则 来 管理 函数 库 ， 该 规则 的 常见 形式 如 下 所 示 : 
«e.a: 
$(CC) -c $(CFLAGS) $< 
$(AR) S(ARFLAGS) $@ $*.0 
FÈS (AR) 和 $ (ARFLAGS) 的 默认 取 值 通常 分 别 是 命令 ar 和 选项 rv。 这 个 相当 简洁 的 语法 告诉 make， 
要 想 从 .c 文 件 得 到 .a 库 文件 ， 它 必须 应 用 上 面 两 条 规则 。 
口 第 一 条 规则 告诉 它 必须 编译 源 文件 以 生成 目标 文件 。 
O 第 二 条 规则 告诉 它 用 ar 命令 将 新 的 目标 文件 添加 到 函数 库 中 。 
因此 ， 如 果 有 一 个 名 为 fud 的 函数 库 ， 其 中 包含 目标 文件 pas.o， 则 第 一 条 规则 中 的 $< 将 被 替换 为 
bas.c， 而 第 二 条 规则 中 的 Se 和 s$* 将 被 分 别 符 换 为 库 文件 fua.a 和 名 字 bas。 


BE rsss oo 


在 实际 应 用 中 ， 管 理 函数 库 规则 的 使 用 非常 简单 。 下 面 将 文件 2.o 和 3.o 放 入 函数 库 my1ib.a 中 。 
你 只 需 对 makefile 文 件 做 很 少 的 修改 ， 最 终 的 makefile 文 件 Makefile5 如 下 所 示 : 


all: myapp 


# Which compiler 
CC = gcc 


* Where to install 
INSTDIR - /usr/local/bin 
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# Where are include files kept 
INCLUDE = . 


# Options for development 
CFLAGS - -g -Wall -ansi 


# Options for release 
# CFLAGS = -O -Wall -ansi 


# Local Libraries 
MYLIB = mylib.a 


myapp: main.o $(MYLIB) 
$(CC) -o myapp main.o $(MYLIB) 


$(MYLIB): $(MYLIB) (2.0) $(MYLIB) (3.0) 
main.o: main.c a.h 

2.0: 2.c a.h b.h 

3.0: 3.c b.h c.h 


clean: 
-rm main.o 2.0 3.0 $(MYLIB) E 


install: myapp 
Gif [ -d $(INSTDIR) ]; \ 
then \ 
cp myapp $(INSTDIR);V 
chmod a+x $(INSTDIR)/myapp; V 
chmod og-w $(INSTDIR)/myapp; V 
echo "Installed in $(INSTDIR) 
else V 
echo "Sorry, $(INSTDIR) does not exist";\ 
fi 


请 注意 ， 我 们 是 如 何 利用 默认 规则 来 完成 大 部 分 工作 的 。 下 面 测试 这 个 新 版 本 的 makefile 文 





件 : 
$ rm -f myapp *.o mylib.a 
$ make -f Makefile5 


gcc -g -Wall -ansi -c -o main.o main.c 
gcc -g -Wall -ansi -c -o 2.0 2.c 

ar rv mylib.a 2.0 

a - 2.0 

gcc -g -Wall -ansi -c -o 3.0 3.c 

ar rv mylib.a 3.0 

a -3.0 


gcc -o myapp main.o mylib.a 
$ touch c.h 
$ make -f Makefili 





gcc -g -Wall -ansi -c -o 3.0 3.c 
ar rv mylib.a 3.0 
rd 


gcc -o myapp main.o mylib.a 
$ 
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首先 ， 删 除 所 有 的 目标 文件 和 库 文件 ， 然 后 执行 make 命 令 创 建 myapp。make 命 令 首先 编译 并 创建 
函数 库 ， 然 后 把 main.o 和 该 函数 库 链接 起 来 以 创建 myapp。 接 下 来 测试 目标 3.o 的 依赖 规则 ， 它 告诉 
make 命 令 ， 当 文件 c.h 发 生 改变 时 ， 源 文件 3.c 必 须 被 重新 编译 。make 命 令 正确 地 完成 了 这 一 工作 ， 
它 首先 编译 源 文件 3.c， 然 后 更 新 函数 库 ， 最 后 重新 链接 函数 库 并 创建 一 个 新 的 可 执行 文件 myapp。 





9.29 高 级 主题 : makefile 文件 和 子 目录 

对 于 大 型 的 项 目 ， 有 时 我 们 希望 能 把 构成 一 个 函数 库 的 几 个 文件 从 主 文件 中 分 离 出 来 ， 并 将 它们 
保存 到 一 个 子 目录 中 。 使 用 make 命 令 完 成 这 一 工作 的 方法 有 两 个 。 

第 一 个 方法 是 , 你 可 以 在 子 目录 中 编写 出 第 二 个 makefile 文 件 , 它 的 作用 是 编译 该 子 目录 下 的 源 
文件 ， 并 将 它们 保存 到 一 个 函数 库 中 ， 然 后 将 该 库 文件 复制 到 上 一 级 的 主 目录 中 。 在 主 目 录 中 的 
makefile 文 件 包含 一 条 用 于 制作 函数 库 的 规则 ， 该 规则 会 调用 第 二 个 makefile 文 件 ， 如 下 所 示 : 

mylib.a: 

(cà mylibdirectory;$ (MAKE) ) 

这 就 是 说 ， 你 必须 总 是 执行 命令 make my1lib.a。 当 make 命 令 调 用 这 条 规则 来 创建 函数 库 时 ， 它 
将 切换 到 子 目录 mylibairectory 中 ， 然 后 调用 一 个 新 的 make 命 令 来 管理 函数 库 。 由 于 make 会 针对 每 
个 命令 调用 一 个 新 的 shell， 而 使 用 第 二 个 makefile 文 件 的 make 命 令 本 身 又 并 没有 执行 ca 命令 ， 但 它 
又 必须 在 一 个 不 同 的 目录 下 创建 函数 库 ， 为 解决 这 一 问题 ， 我 们 用 括号 将 这 两 个 命令 括 起 来 ， 从 而 确 
保 它们 只 被 一 个 单独 的 shell 处 理 。 

第 二 个 方法 是 , 在 原来 的 makefile 文 件 中 添加 一 些 宏 。 新 添加 的 宏 通过 在 我 们 已 见 过 的 宏 的 尾部 
追加 一 个 字母 得 到 , 字母 Dp 代表 目录 , 字母 F 代 表 文件 名 ,然后 你 就 可 以 用 下 面 的 规则 来 替换 内 置 的 .c.o 
后 级 规则 : 

.e.0: 

$(CC) $(CFLAGS) -c $(0D)/S(«F) -o $(8D)/S(GF) 
这 条 规则 的 作用 是 : 编译 子 目录 中 的 源 文件 并 将 目标 文件 放 在 该 子 目 录 中 。 然 后 ， 你 用 如 下 的 依赖 关 
系 和 规则 来 更 新 当前 目录 下 的 函数 库 : 
mylib.a: mydir/2.0 mydir/3.o 
ar -rv mylib.a $? 

在 项 目 中 究竟 使 用 哪 种 方法 是 由 读者 决定 的 。 许 多 项 目 避 免 使 用 子 目录 ， 但 这 将 导致 在 主 目录 中 
存在 大 量 的 源 文件 。 可 以 从 上 面 的 简介 中 看 到 ， 你 只 需要 为 makefile 文 件 稍微 增加 一 点 复杂 性 ， 即 可 
在 make 命 令 中 使 用 子 目录 。 


9.2.10 GNU make fll gcc 


GNU 的 make 命 令 和 GNU 的 gcc 编 译 器 有 下 面 两 个 有 趣 的 选项 。 

O 第 一 个 选项 是 make 命 令 的 -jN (字母 j 是 英文 单词 jobs 的 首 字母 ) 选项， 它 允 许 make 命 令 同时 执 
行 N 条 命令 。 如 果 项 目的 不 同 部 分 可 以 彼此 独立 地 进行 编译 ，make 命 令 就 可 以 同时 调用 几 条 规 
则 。 根据 系 统 的 配置 情况 ， 这 种 做 法 可 以 极 大 地 缩短 重新 编译 所 需要 花费 的 时 间 。 如 果 有 许多 
源 文件 ， 这 个 选项 就 值得 一 试 。 一 般 来 说 ， 你 可 以 先 从 较 小 的 数字 (比如 -j3》 开 始 尝试 。 但 
如 果 需 要 与 其 他 用 户 共享 你 的 计算 机 ,就 要 小 心 使 用 这 个 选项 , 因为 其 他 用 户 可 能 并 不 喜欢 你 
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每 次 编译 时 都 启动 大 量 的 进程 。 

O 另 一 个 有 用 的 选项 是 gcc 的 -xx 选项 。 它 的 作用 是 产生 一 个 适用 于 make 命 令 的 依赖 关系 清单 。 
如 果 某 个 项 目 包含 非常 多 的 源 文件 ， 每 个 源 文件 又 包含 不 同 的 头 文件 组 合 , 则 理 清 它们 之 间 的 
依赖 关系 将 非常 困难 〈 但 又 非常 重要 )。 如 果 让 每 个 源 文件 都 依赖 于 所 有 的 头 文件 ， 有 时 候 你 
就 会 编译 一 些 没有 必要 编译 的 文件 。 但 从 另 一 方面 来 看 ， 如 果 忽 略 一 些 依赖 关系 ， 问 题 会 变 得 
更 严重 ， 因 为 你 没有 重新 编译 一 些 需要 编译 的 文件 。 


Eg gcc -MM 


在 这 个 实验 中 ， 你 用 gcc 的 -Mw 选项 来 生成 上 面 示例 项 目 中 的 依赖 关系 清单 : 
$ gcc -MM main.c 2.c 3.c 

main.o: main.c a.h 

2.0: 2.c a.h b.h 

3.0: 3.c b.h c.h 

$ 


gcc 编 译 器 扫描 源 文件 以 查找 incluae 语 句 ， 然 后 以 一 种 适合 于 直接 插入 到 makefile 文 件 中 的 格 
式 输出 需要 的 依赖 关系 清单 。 你 只 需 先 把 这 个 输出 结果 保存 到 一 个 临时 文件 中 ， 然 后 把 它们 插入 到 
makefile 文 件 中 ， 即 可 得 到 一 组 完美 的 依赖 关系 规则 。 如 果 拥 有 gcc 编 译 器 ， 却 还 出 现 依赖 关系 的 错 
误 就 不 应 该 了 ! 

如 果 你 对 制作 makefile 文 件 非常 有 信心 , 也 可 以 尝试 使 用 makedepend 工 具 , 它 的 功能 与 -My 选 项 
很 类 似 ， 但 其 做 法 是 将 依赖 关系 直接 附加 到 指定 的 makefile 文 件 的 末尾 。 

在 结束 对 makefile 文 件 的 介绍 之 前 ， 我 们 有 必要 指出 makefile 文 件 并 不 仅 用 于 编译 源 代码 或 创 
建 函 数 库 。 只 要 是 可 以 通过 一 系列 命令 从 某 些 类 型 的 输入 文件 得 到 输出 文件 的 任务 ， 你 都 可 通过 
makefile 文 件 来 自动 地 完 -个 典型 的 “ 非 编译 器 ”用 途 是 ， 通 过 调用 awk 或 sed 命 令 对 一 些 文件 
进行 处 理 , 或 甚至 通过 makefile 文 件 来 生成 使 用 手册 。 你 可 以 通过 它 对 任何 与 文件 操纵 相关 的 任务 进 
行 自动 化 处 理 ， 只 要 make 命 令 可 以 根据 文件 的 日 期 和 时 间 信 息 判断 出 哪个 文件 发 生 了 改变 即 可 。 

另 一 种 用 于 控制 程序 创建 或 完成 其 他 自动 化 任务 的 工具 是 ANT。 它 是 一 个 基于 Java 的 工具 * 它 使 
用 基于 XML 的 配置 文件 。 这 个 工具 并 不 常 被 用 于 自动 化 处 理 Linux 系 统 上 C 语 言 文件 的 创建 ， 所 以 我 们 
不 会 在 这 里 对 它 作 进一步 的 介绍 。 你 可 以 通过 网 址 http:/antapache.org 找 到 有 关 ANT 的 详细 资料 。 


9.3 ” 源 代码 控制 


如 果 你 做 的 不 是 一 个 简单 的 项 目 ， 特 别 是 项 目的 开发 人 员 不 止 一 个 时 ， 为 避免 文件 修改 的 冲突 并 
跟踪 对 源 文件 所 作出 的 修改 ， 对 源 文件 改动 方面 的 管理 就 变 得 非常 重要 。 

UNIX 中 有 几 个 被 广泛 使 用 的 用 于 管理 源 文件 的 系统 ， 如 下 所 示 。 

口 SCCS: 源 代码 控制 系统 。 

口 RCS: 版 本 控制 系统 。 

口 CVS: 并 发 版 本 控制 系统 。 

O Subversion. 

SCCS 是 由 AT&T 在 系统 V 版 本 的 UNIX 中 引入 的 最 初 的 源 代码 控制 系统 , 现在 它 已 是 X/Open 标 准 的 一 部 
分 了 。RCS 是 在 这 之 后 开发 的 ， 它 作为 SCCS 的 一 个 免费 蔡 换 系统 ， 由 自由 软件 基金 会 发 布 。RCS 的 功能 与 
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SCCS 非 常 类 似 ， 但 它 有 着 更 直观 的 接口 和 一 些 其 他 的 选项 ， 所 以 SCCS 基 本 上 已 被 RCS 所 取代 。 

RCS 工 具 是 Linux 发 行 版 中 的 一 个 常见 套件 ， 你 也 可 以 从 自由 软件 基金 会 的 网 址 http://directory.fsf.org/ 
res.html 上 下 载 它 及 其 源 代码 。 

CVs 是 一 个 比 SCCS 和 RCS 更 高 级 的 工具 ， 它 用 于 基于 互联 网 的 协同 开发 。 你 可 以 在 大 多 数 Linux 
发 行 版 中 找到 它 ， 你 也 可 以 通过 网 址 http://www.nongnu.org/cvs/ 下 载 它 。 与 RCS 相 比 ， 它 有 两 个 显著 的 
优势 ， 可 以 通过 网 络 使 用 ， 并 且 允 许 并 发 开发 。 

Subversion 是 一 个 新 开发 的 工具 ， 它 旨 在 最 终 赫 换 CVS。 它 的 主页 是 http:/www.subversion.org。 

在 本 章 中 ， 我 们 将 重点 介绍 RCS 和 CVS。 介 绍 RCS 是 因为 它 对 个 人 的 开发 项 目 来 说 易于 使 用 ， 并 
且 它 与 make 整 合 得 很 好 。 介 绍 CVS 是 因为 它 是 用 于 合作 项 目的 最 常见 的 源 代码 控制 形式 。 鉴 于 SCCS 
作为 POSIX 标 准 的 地 位 ， 我 们 还 将 简要 地 比较 RCS 命 令 和 SCCS 命 令 ， 并 对 CVS 和 Subversion 中 的 一 些 
用 户 命令 进行 比较 。 


9.3.1 RCS 


版 本 控制 系统 (RCS) 提供 了 许多 用 于 管理 源 文件 的 命令 。 它 能 够 跟踪 并 记录 下 源 文 件 的 每 一 次 
改动 ， 并 将 这 些 改动 都 记录 在 一 个 文件 中 ， 该 文件 中 记录 的 改动 信息 足够 详细 ， 你 可 以 通过 这 些 信息 
重建 出 任何 一 个 以 前 的 版 本 。 允许 你 为 每 次 改动 保存 一 个 与 之 对 应 的 注释 信息 ， 这 对 了 解 文件 改 
动 的 历史 非常 有 用 。 

随 着 项 目的 进展 ， 你 可 以 将 每 次 对 源 文件 进行 的 大 的 改动 或 漏洞 的 修补 分 别 进行 记录 ， 并 针对 每 
次 改动 保存 注释 。 当 需要 回顾 对 文件 曾经 做 过 的 改动 、 检 查 何 时 修补 过 漏洞 或 何 时 引入 漏洞 时 ， 这 就 
非常 有 用 。 

因为 RCS 只 保存 版 本 之 间 的 不 同 之 处 ， 所 以 它 非常 节省 存储 空间 。 万 一 不 小 心 误 删 了 文件 ，RCS 
还 可 以 帮助 你 找 回 以 前 的 版 本 。 

1. rcs 命 令 

为 便于 说 明 ， 我 们 从 一 个 需要 管理 的 文件 的 初始 化 版 本 开始 介绍 。 在 本 例 中 ， 我 们 使 用 的 文件 为 
important .c， 它 实际 上 是 文件 Etoo.c 的 一 份 副本 ， 但 在 文件 的 开头 加 上 了 如 下 的 注释 ， 

This is an important file for managing this project. 

It implements the canonical "Hello World" program. 

"n 

第 一 个 任务 是 用 rcs 命 令 来 初始 化 该 文件 的 RCS 控 制 。 命 令 rcs -i 的 作用 是 初始 化 RCS 控 制 文 
件 。 


$ rcs -i important.c 

RCS file: important.c,v 

enter description, terminated with single '.' or end of file: 
NOTE: This is NOT the log message! 

»» This is an important demonstration file 

». 

done 

$ 


你 可 以 使 用 多 行 注释 , 结束 输入 需要 在 一 行 中 单独 使 用 一 个 英文 句号 (.) 或 输入 文件 结束 字符 ( 通 
常 是 组 合 键 Ctrl+D)。 
执行 完 这 条 命令 后 ，rcs 将 创建 一 个 新 的 只 读 文件 ， 该 文件 的 后 绷带 有 ,v， 如 下 所 示 : 
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$ 1s -1 
en Y=- 1 neil users 225 2007-07-09 07:52 important.c 
PP 1 neil users 105 2007-07-09 07:52 important.c,v 
$ 

如 果 硕 望 能 把 RCS 文 件 保存 到 另 一 个 目录 中 ,你 只 需 在 第 一 次 使 用 rcs 命 令 之 前 建立 一 个 
名 为 RCS 的 子 目 录 ， 这 样 所 有 的 zcs 命 令 都 会 自动 地 把 RCs 文 件 保存 到 该 子 目录 中 。 


2. ci 命令 
现在 可 以 使 用 ci 命令 将 源 文件 的 当前 版 本 “ 签 入 ”(check in) 到 RCS 中 了 : 
$ ci important.c 


important.c,v <-- important.c 
initial revision: 1.1 

done 

$ 


如 果 先 前 忘记 执行 rcs -i 命令 了 ， 在 执行 ci 命令 时 ，RCS 会 要 求 输入 一 段 对 该 文件 的 描述 。 如 果 
现在 查看 目录 中 的 内 容 ， 你 将 会 发 现 文件 important .c 已 被 删除 ; 


$ 1s -1 
-r--r--r-- 1 neil users 443 2007-07-07 07:54 important.c,v 
$ 

文件 内 容 及 其 控制 信息 都 已 经 被 保存 到 RCS 文 件 important .c,v 中 了 。 

3. co 命令 


如 果 想 修改 文件 ， 你 必须 首先 “ 签 出 ”(check out) 该 文件 。 如 果 只 是 想 阅 读 该 文件 ， 你 可 以 用 
co 命令 重建 当前 版 本 的 该 文件 并 将 它 的 权限 改 为 只 读 。 如 果 想 对 其 进行 修改 ， 你 就 必须 用 命令 co -1 
锁定 该 文件 ， 因 为 在 一 个 项 目 组 中 ， 必 须 确保 任 一 时 刻 只 有 一 个 人 可 以 修改 指定 的 文件 ， 这 也 是 指定 
版 本 的 文件 只 能 有 一 份 副本 拥有 写 权限 的 原因 。 当 文件 以 可 写 方式 被 “ 签 出 ”时 ， 对 应 的 RCS 文 件 将 


被 锁定 。 
$ co -1 important.c 
important.c,v --» important.c 
revision 1.1 (locked) 
done 
$ 
然后 查看 目录 内 容 : 
$ 1s -1 a 
-rw-r--r-- 1 neil users 225 2007-07-09 07:55 important.c 
-r--r--r-- 1 neil users 453 2007-07-09 07:55 important.c,v 
$ 


现在 有 了 可 以 进行 编辑 的 文件 ， 你 对 其 进行 修改 ， 把 新 版 本 存盘 ， 然 后 再 次 用 ci 命令 保存 改动 。 
现在 文件 important .c 中 的 输出 部 分 代码 如 下 所 示 : 
printf(*Hello World\n"); 
Printf ("This is an extra line added laterin*); 
以 如 下 方式 使 用 ci 命令 : 


$ ci important.c 

important.c,v <-- important.c 

new revision: 1.2; previous revision: 1.1 

enter log message, terminated with single '.' or end of file: 
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>> Added an extra line to be printed out. 
ra 

done 

$ 


如 果 想 在 “ 签 入 ”该 文件 时 仍然 保留 文件 的 锁定 状态 ， 使 得 可 以 继续 对 该 文件 进行 修改 ， 你 就 需要 
在 调用 ci 命令 时 加 上 -1 选项 。 这 样 ， 在 “ 签 入 ”该 文件 的 同时 它 会 被 自动 “ 签 出 ”来 供 同一 用 户 使 用 。 

现在 ， 你 已 保存 了 该 文件 的 修订 版 本 。 如 果 查 看 目录 内 容 ， 你 就 会 发 现 文件 important .c 再 次 被 
删除 了 : 

$ 1s -1 


-r--r--r-- 1 neil users 635 2007-07-09 07:55 important.c,v 
$ 


4. rlog 命 令 
查看 一 个 文件 的 改动 摘要 通常 是 很 有 用 的 。 你 可 以 用 rlog 命 令 来 完成 这 一 功能 : 
$ rlog important.c 


RCS file: important.c,v 
Working file: important.c 
head: 1.2 

branch: 

locks: strict 

access list: 

symbolic names: 

keyword substitution: kv 


total revisions: 2; selected revisions: 2 
description: 
Thi demonstration file 








date: 2007/07/09 06:57:33; author: neil; state: Exp; lines: «1 -0 


revision 1.1 
date: 2007/07/09 06:54:36; author: neil; state: Exp; 
Initial revision 





输出 结果 中 的 第 一 部 分 给 出 了 对 该 文件 的 描述 以 及 rcs 使 用 的 选项 。 接 着 ，rlog 命 令 列 出 对 该 广 
件 的 修改 情况 和 你 “ 签 入 ”该 文件 时 输入 的 注释 内 容 ， 最 近 的 修改 列 在 最 前 面 。 版 本 1.2 中 的 line: +1 
-0 表明 在 这 一 修订 版 本 中 增加 了 一 行 ， 未 删除 行 。 
注意 ,文件 修改 时 间 在 存储 时 不 会 进行 夏令 时 调整 ， 这 是 为 了 避免 在 改变 时 钟 时 可 能 会 
带 来 的 问题 . 


如 果 现在 想 取出 该 文件 的 第 一 个 版 本 ， 你 可 以 在 调用 co 命令 时 指定 需要 的 版 本 号 ， 如 下 所 示 : 
$ co -r1.1 important.c 

important.c,v --» important.c 

revision 1.1 

done 

$ 
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ci 命令 也 有 一 个 -r 选 项 ， 它 的 作用 是 强制 指定 主 版 本 号 ， 例 如 命令 ci -r2 important .c 将 把 文 
件 imporcant .c“ 签 入 ”为 版 本 2.1。RCS 和 SCCS 默 认 都 用 数字 1 作为 第 一 个 次 版 本 号 。 

5. rcsdiff 命 令 

如 果 只 是 想 了 解 两 个 版 本 之 间 的 区 别 ， 你 可 以 使 用 命令 rcsGiff: 

$ rcsdiff -rl.1 -r1.2 important.c 





RCS fil important.c 

retrieving revision 1. 

retrieving revision 1 

diff -rl.l -r1.2 

11a12 

> printf('This is an extra line added later\n"); 

$ 

上 面 的 输出 结果 表明 在 原文 件 的 第 11 行 后 插入 了 一 行 。 

6. 标识 版 本 

RCS 系 统 可 以 在 源 文件 中 使 用 一 些 特殊 的 字符 串 〈 宏 ) 来 帮助 跟踪 文件 所 做 的 改动 。 最 常用 的 两 
个 宏 是 $sRcsfile$ 和 $Id$。 宏 $Rcsfiles 将 扩展 为 该 文件 的 名 字 ， 而 宏 $Ia 将 扩展 为 一 个 标识 版 本 号 
的 字符 串 。RCS 系 统 支持 的 特殊 字符 串 的 完整 列表 请 查看 在 线 帮助 手册 。 这 些 宏 将 在 文件 被 “ 签 出 ” 
时 扩展 ， 并 且 在 文件 被 “ 签 入 ”时 自动 更 新 。 

下 面 我 们 对 文件 important .c 进 行 第 三 次 修改 ， 增 加 一 些 宏 : 

$ co -1 important.c 


important.c,v --» important.c 
revision 1.2 (locked) 

done 

$ 


BUE ff xc FAR: 


#include <stdlib.h> 
#include <stdio.h> 


"n 
This is an important file for managing this project. 
It implements the canonical "Hello World* program. 
Filename: $RCSfile$ 

^ 


static char *RCSinfo = "$Id$"; 


int main() ( 
printf('Hello WorldWn*); 
printf('This is an extra line added lateri"); 
printf(*This file is under RCS control. Its ID isWn$s|n', RCSinfo); 
exit(EXIT SUCCESS); 
) 


现在 “ 签 入 ”该 版 本 ， 看 看 RCS 是 如 何 管理 这 些 特殊 字符 串 的 : 


$ ci important.c 
important.c,v <-- important.c 
new revision: 1.3; previous revision: 1.2 
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enter log message, terminated with single '.' or end of file: 
>> Added $RCSfile$ and $Id$ strings 

done 

$ 


如 果 查 看 目录 内 容 ， 你 将 发 现 只 有 RCS 文 件 存在 : 


1 neil users 907 2007-07-09 08:07 important.c,v 





如 果 “ 签 出 ”( 使 用 co 命令 ) 该 文件 并 检查 该 源 文件 的 当前 版 本 ， 你 就 会 发 现 宏 已 被 扩展 。 


#include <stdlib.h> 
#include <stdio.h> 


7 
This is an important file for managing this project. 
It implements the canonical "Hello World* program. 
Filename: $RCSfile: important.c,v $ 

Wi. 


static char *RCSinfo = "$Id: important.c,v 1.3 2007/07/09 07:07:08 neil Exp $"; 


int main() ( 
printf(*Hello World\n"); 
printf ("This is an extra line added later\n"); 
printf('This file is under RCS control. Its ID is\n%s\n", RCSinfo); 
exit(EXIT SUCCESS); 
) 


实验 GNU make 和 RCS 


GNU 的 make 命 令 已 内 置 了 一 些 用 于 管理 RCS 文 件 的 规则 。 在 本 例 中 , 你 将 看 到 make 命 令 是 如 何 处 
理 缺 少 源 文件 的 情况 的 。 


$ rm -f important.c 
$ make important 
co important.c,v important.c 


important.c,v --» important.c 
revision 1.3 

done 

cc -c important.c -o important.o 
CC important.o -o important 

rm important.o important .c 

$ 


make 命 令 有 这 样 一 条 默认 规则 :， 当 make 制 作 的 目标 是 一 个 没有 后 组 名 的 文件 时 ，make 将 编译 具 
有 同样 的 名 字 但 加 上 .c 后 组 名 的 源 文件 . make 命令 具有 的 第 二 条 默认 规则 允许 make 命令 通过 RCS 系 统 
从 文件 important .c,v 创 建 出 文件 important .c。 在 这 个 例子 中 , 由 于 文件 important .c 不 存在 , make 
命令 就 用 co 命令 " 签 出 ”该 文件 的 最 新 版 本 。 编译 完成 后 ， 它 还 会 删除 文件 important .c 来 清理 目录 。 





36 第 9 章 开发 工具 





7. ident 命 令 

你 可 以 用 ident 命 令 查找 包含 srds 字 符 串 的 文件 的 版 本 。 因 为 你 将 字符 串 保存 到 一 个 变量 中 ， 所 
以 它 也 会 出 现在 最 终 的 可 执行 程序 中 。 你 可 能 会 发 现 ， 如 果 在 源 代码 中 加 入 一 些 特 殊 字 符 串 ， 但 未 使 
用 它们 ， 一 些 编译 器 就 会 出 于 优化 的 目的 将 其 删除 。 为 解决 这 个 问题 ， 你 可 以 在 代码 中 增加 一 些 对 这 
些 字符 串 的 “ 假 ”访问 ， 但 随 着 编译 器 越 来 越 好 ， 解 决 这 个 问题 也 会 变 得 越 来 越 困难 ! 

下 面 这 个 简单 的 例子 将 显示 ， 你 如 何 使 用 iaent 命 令 来 验证 用 于 建立 一 个 可 执行 文件 的 源 文件 的 
RCS 版 本 。 


| identfr4 


$ ./important 
Hello World 
This is an extra line added later 
This file is under RCS control. Its ID is 
$1d: important.c,v 1.3 2007/07/09 07:07:08 neil Exp $ 
$ ident important 
important: 
$Id: important.c,v 1.3 2007/07/09 07 :07 :08 neil Exp $ 








$ 


通过 执行 程序 ， 你 看 到 字符 串 确实 已 合并 到 可 执行 文件 中 。 接 着 ， 你 用 iGent 命 令 从 可 执行 文件 
里 提取 出 $Id$ 字 符 串 。 

使 用 RCS 系 统 及 出 现在 可 执行 文件 中 的 $IG$ 字 符 串 的 技巧 可 以 成 为 一 个 功能 非常 强大 的 工具 , E 
有 助 于 确定 客户 报告 有 问题 的 文件 的 版 本 。 你 还 可 以 将 RCS (或 SCCS〉 作 为 项 目 跟踪 工具 的 一 部 分 ， 
用 它 来 跟踪 报告 的 问题 及 其 解决 方法 。 如 果 你 做 的 是 软件 销售 工作 ， 或 者 哪怕 是 赠送 软件 ， 了 解 不 同 
版 本 之 间 的 改动 情况 也 是 非常 重要 的 。 

如 果 还 想 了 解 有 关 RCS 的 更 多 信息 ， 除 标准 的 RCS 手 册页 以 外 ,使 用 手册 中 的 rcsintro 页 面 给 出 
了 完整 的 RCS 系 统 介 绍 。ci、co 等 命令 也 有 其 各 自 的 手册 页 。 





9.3.2 SCCS 

SCCS 提 供 了 与 RCS 非 常 类 似 的 功能 。SCCS 的 优势 在 于 ， 它 得 到 了 X/Open 规范 的 定义 ， 因 此 所 有 
正规 的 UNIX 系 统 都 应 该 支持 它 。 但 较 现实 的 情况 是 ，RCS 的 可 移植 性 非常 好 ， 并 且 可 以 自由 发 布 。 
所 以 ， 如 果 你 有 一 个 类 UNIX 系 统 ， 不 管 它 是 否 遵循 X/Open 规范 ， 你 都 可 以 在 其 上 获取 并 安装 RCS。 
因此 ， 我 们 不 准备 对 SCCS 做 进 9 介绍 ， 而 只 对 这 两 个 系统 各 自 使 用 的 命令 进行 简单 的 比较 ， 以 
方便 那些 准备 在 这 两 个 系统 之 间 进 行 切 换 的 用 户 。 


9.33 RCS 和 SCCS 的 比较 


直接 比较 这 两 个 系统 所 提供 的 命令 是 很 困难 的 , 所 以 表 9-2 只 能 被 看 作 是 一 个 简单 的 起 点 。 这 里 列 
出 的 两 个 系统 的 命令 在 完成 同一 项 任务 时 并 不 使 用 相同 的 选项 ， 如 果 不 得 不 使 用 SCCS 系 统 ， 你 就 必 
须 自己 查找 合适 的 选项 ， 但 至 少 现在 你 应 该 知道 从 哪里 开始 查找 了 。 
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表 9-2 
RCS sccs 
rcs admin 
ci Delta 
co Get 
rcsditf Sccsdiff 
ident what 





除 上 面 列 出 的 那些 命令 外 , SCCS 系 统 中 的 sccs 命 令 在 功能 上 与 RCS 系 统 中 的 rcs 和 co 命令 有 些 相 
交 。 例 如 ， 命 令 sccs edit 和 sccs creace 就 分 别 相当 于 命令 co -1 和 rcs -i。 


9.34 CVS 


除 使 用 RCS 系 统 外 ， 管 理 文件 改动 的 另外 一 种 方法 是 使 用 CVS 系 统 ， 即 并 发 版 本 控制 系统 。CVS 
系统 现在 变 得 非常 流行 ， 可 能 是 因为 与 RCS 系 统 相 比 ， 它 有 一 个 明显 的 优势 : 人 们 可 以 通过 互联 网 使 
用 CVS 系 统 ， 而 不 像 RCS 系 统 只 能 用 在 一 个 共享 的 本 地 目录 中 。CVS 还 支持 并 行 开发 ， 即 许多 程序 员 
可 以 在 同一 时 间 修 改 同一 个 文件 ， 而 RCS 在 任 一 时 间 只 允许 一 个 用 户 修改 一 个 特定 文件 。CVS 的 命令 
与 RCS 的 类 似 ， 这 是 因为 CVS 最 初 是 作为 RCS 的 一 个 前 端 程序 来 开发 的 。 

由 于 CVS 系 统 能 够 以 灵活 的 方式 跨 网 络 运行 ， 所 以 它 适用 于 软件 开发 者 之 间 唯 一 的 网 络 连接 方式 
就 是 通过 互联 网 这 种 情况 。 许多 Linux 和 GNU 项 目 就 是 通过 CVS 系 统 来 帮助 不 同 的 开发 者 协同 工作 的 。 
一 般 而 言 ， 通 过 CVS 系 统 对 远 端 文件 进行 操作 与 通过 它 处 理 本 地 文件 并 无 区 别 。 

在 本 章 中 ， 我 们 将 简要 地 介绍 CVS 的 基础 知识 ， 通 过 学 习 ， 你 可 以 开始 使 用 本 地 版 本 库 ， 并 知道 
如 何 通过 互联 网 ， 从 CVS 服 务 器 上 获取 项 目的 最 新 源 文件 副本 。 有 关 CVS 的 更 详细 信息 请 参考 由 Per 
Cederqvist 等 撰写 的 CVS 使 用 手册 ， 该 手册 位 于 网 址 http://ximbiotcom/cvsmanual/， 你 还 可 以 在 该 网 址 
上 找到 FAQ 文 件 和 其 他 一 些 有 帮助 的 文件 。 

首先 ， 你 需要 创建 一 个 版 本 库 ，CVS 系 统 将 其 控制 文件 和 它 管理 的 文件 的 主 副本 保存 在 这 个 版 本 
库 中 。 版 本 库 的 结构 是 树 状 的 ， 所 以 你 不 仅 可 以 把 一 个 项 目的 完整 目录 结构 保存 在 一 个 版 本 库 中 ， 还 
可 以 在 同一 个 版 本 库 中 保存 多 个 项 目 。 当 然 ， 你 也 可 以 将 彼此 没有 关联 的 项 目 分 别 保存 到 不 同 的 版 本 
库 中 。 你 将 在 后 面 看 到 如 何 告诉 CVS 系 统 你 要 使 用 哪 一 个 版 本 库 。 

1. CVS 的 本 地 使 用 

我 们 首先 创建 一 个 版 本 库 。 为 保持 简单 ， 这 将 是 一 个 本 地 版 本 库 ， 并 且 因 为 你 将 只 使 用 这 一 个 版 
本 库 ， 所 以 适宜 将 其 放 到 /usr/1ocal 目 录 下 。 在 大 多 数 的 Linux 发 行 版 中 ， 所 有 的 普通 用 户 都 属于 组 
users， 所 以 将 该 版 本 库 的 属 组 也 设 为 users， 这 样 所 有 用 户 都 可 以 访问 它 了 。 

以 超级 用 户 的 身份 为 版 本 库 创 建 目录 : 

* mkdir /usr/local/repository 


* chgrp users /usr/local/repository 
* chmod g*w /usr/local/repository 


切换 为 普通 用 户 ， 将 该 目录 初始 化 为 一 个 CVS 版 本 库 。 如 果 你 不 属于 users 组 ， 那 么 需要 拥有 目 
录 /usr/local/repository 的 写 权 限 ， 才 能 执行 这 一 操作 。 

$ cvs -d /usr/local/repository init 

-a 选 项 告诉 CVS 你 希望 版 本 库 创建 在 哪个 目录 中 。 

现在 版 本 库 已 创建 好 ， 你 可 以 将 项 目的 初始 版 本 保存 到 CVS 中 了 。 做 这 项 工作 时 ， 你 可 以 利用 一 
个 小 技巧 来 节省 一 些 打字 的 时 间 。 所 有 的 cvs 命 令 在 查找 CVS 目 录 时 都 可 以 使 用 两 种 方法 ， 一 是 在 命 











338  $9* 开发 工具 





令 行 中 使 用 -a <path> 选 项 《就 像 你 刚才 使 用 init 命 令 时 那样 )， 如果 未 使 用 -a 选 项 ，cvs 命 令 就 会 去 
查看 环境 变量 CVsROoT 的 值 。 你 不 想 在 每 次 执行 cvs 命 令 时 都 加 上 -a 选项 ， 所 以 你 将 用 第 二 种 方法 设 
置 环境 变量 cvsRoor。 如 果 使 用 的 shell 是 bash， 则 设置 环境 变量 的 方法 如 下 所 示 : 

$ export CVSROOT-/usr/local/repository 

首先 ， 切 换 到 项 目 所 在 的 目录 ， 然 后 告诉 CVS 导 入 该 目录 下 的 所 有 文件 。 对 CVS 系 统 而 言 ， 一 个 
项 目 就 是 相关 文件 和 目录 的 集合 。 一 般 来 说 ， 它 包括 用 于 创建 应 用 程序 所 需 的 所 有 文件 。 术 语 导 入 的 
含义 是 ， 将 文件 置 于 CVS 的 控制 之 下 ， 并 将 它们 复制 到 CVS 版 本 库 中 。 对 本 例 来 说 ， 你 有 一 个 名 为 
cvs-sp (HICVS simple project 的 缩写 ) 的 目录 ， 它 包含 两 个 文件 ，hello.c 和 Makefile: 





$ cd cvs-sp 

$ 1s -1 

-rw-r- 1 neil users 68 2003-02-15 11:07 Makefile 
-rw-r--r-- — 1 neil users 109 2003-02-15 11:04 hello.c 


CVS 导 入 命令 是 cvs import， 它 的 使 用 方法 如 下 所 示 ; 

5 cvs import -m"Initial version of Simple Project" wrox/chap9-cvs wrox start 

上 面 这 条 命令 告诉 CVS 导 入 当前 目录 〈cvs-sp) 下 的 所 有 文件 ， 同 时 为 其 加 上 一 条 日 志 信息 。 

参数 wrox/chap9-cvs 告 诉 CVS 保 存 新 项 目的 位 置 ， 这 里 给 出 的 是 相对 于 CVS 树 根 的 路 径 。 请 记 
住 ， 只 要 你 愿意 ，CVS 可 以 在 同一 个 版 本 库 中 保存 多 个 项 目 。 选 项 wrox 相 当 于 厂商 标签 ， 它 用 于 标识 
导入 文件 的 初始 版 本 的 提供 者 。 选 项 start 是 一 个 版 本 标签 用 于 标识 一 组 相关 的 文件 ， 例 如 构成 
-个 软件 特定 版 本 的 一 组 文件 。CVS 对 上 面 命令 的 响应 如 下 所 示 : 

N wrox/chap9-cvs/hello.c 

N wrox/chap9-cvs/Makefile 








No conflicts created by this import 


输出 结果 表明 它 成 功 地 导入 了 两 个 文件 。 

现在 是 查看 能 否 从 CVS 系 统 中 获取 文件 的 好 时 机 。 你 可 以 先 建立 一 个 junk 目 录 ， 然后 导出 文件 以 
确认 一 切 工作 正常 。 

$ mkdir junk 

$ ed junk 

$ cvs checkout wrox/chap9-cvs 

U wrox/chap9-cvs/Makefile 

U wrox/chap9-cvs/hello.c 

你 向 CVS 给 出 与 导入 文件 时 相同 的 路 径 。CVS 在 当前 目录 中 创建 wrox/chap9-cvs 子 目录 ， 然 后 
将 文件 放 到 该 子 目录 中 。 

现在 开始 对 项 目 做 一 些 改动 。 编 辑 目 录 wrox/chap9-cvs 中 的 文件 hello.c， 并 对 它 做 一 个 小 的 修 
改 ， 在 该 文件 中 添加 下 面 一 行内 容 : 


printf(*Have a nice day\n"); 


然后 重新 编译 并 运行 程序 以 保证 一 切 顺利 。 
$ make 

Cc hello.c -o hello 

$ ./hello 

Hello World 

Have a nice day 
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你 可 以 询问 CVS 这 个 项 目 有 哪些 改动 。 你 并 不 需要 告诉 CVS 你 关心 的 文件 具体 是 哪个 ， 它 能 够 一 
次 性 完成 对 整个 目录 的 检查 ; 


$ cvs diff 
CVS 响 应 如 下 : 


cvs diff: Diffing . 
Index: hello.c 






RCS fil /usr/local/repository/wrox/cha; 
retrieving revision 1.1.1.1 

diff -r1.1.1.1 hello.c 

6a7 

> printf(*Have a nice day\n*); 

你 对 自己 做 的 改动 很 满意 ， 所 以 决定 将 其 提交 给 CVS。 

当 把 改动 提交 给 CVS 时 ， 它 会 启动 -个 编辑 器 让 你 输入 一 条 日 志 信息 。 你 可 以 在 运行 commit 命 令 
之 前 ， 通 过 设置 环境 变量 cvsepIroR 来 强制 使 用 -个 特定 的 编辑 器 。 

$ cvs commit 

CVS 的 响应 表明 它 正在 导入 的 内 容 : 

CVS commit: Examining . 

Checking in hello.c; 
Jusr/local/repository/wrox/chap9-cvs/hello.c,v «-- hello.c 


new revision: 1.2; previous revision: 1.1 
done 


现在 可 以 询问 CVS， 这 个 项 目 自 第 次 导入 后 的 改动 情况 。 你 询问 的 是 项 目 wrox/chap9-cvs 自 
版 本 1.1( 即 初始 化 版 本 ) 以 来 的 所 有 改动 情况 。 

$ cvs rdiff -r1.1 wrox/chap9-cvs 

CYVS 给 出 的 结果 如 下 ; 

CVs rdiff: Diffing wrox/chap9-cvs 

Index: wrox/chap9-cvs/hello.c 

diff -c wrox/chap9-cvs/hello.c:l.1 wrox/chap9-cvs/hello.c:1.2 

7'* wrox/chap9-cvs/hello.c:l.l Mon Jul 9 09:37:13 2007 

--- wrox/chap9-cvs/hello.c Mon Jul 9 09:44:36 2007 


tae 4,8 tere 
ms MTM 
int main() 
{ 
printf(*Hello World\n"); 
+ Printf ("Have a nice day\n"); 
exit (EXIT SUCCESS); 


$ 
假设 在 CVS 系 统 之 外 的 本 地 目录 中 还 有 一 份 代码 的 副本 ， 现在 你 想 刷新 该 目录 中 的 文件 以 更 新 那 
些 你 没有 修改 过 、 但 已 被 其 他 人 改动 过 的 文件 。 CVS 的 update 命 令 可 以 帮助 你 完成 这 一 工作 。 首 先 移 
动 到 项 目 路 径 的 项 层 ， 在 本 例 中 就 是 包含 wrox 子 目录 的 目录 ， 然后 执行 下 面 的 命令 ; 


$ cvs update -Pd wrox/chap9-cvs 


CVS 开 始 刷新 相关 文件 ， 它 把 其 他 人 修改 过 而 你 未 动 过 的 文件 从 版 本 库 中 提取 出 来 ， 并 放 到 你 的 au 
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本 地 目录 中 。 当 然 ， 其 中 一 些 修改 可 能 与 你 做 的 修改 有 冲突 ， 但 这 是 需要 你 解决 的 问题 ，CVS 是 好 东 
西 ， 但 它 并 不 是 无 所 不 能 ! 

至 此 ， 你 应 该 可 以 看 出 ，CVS 的 用 法 与 RCS 相 当 接 近 。 但 它们 之 间 其 实 有 一 个 我 们 还 未 提 及 的 十 
分 重要 的 区 别 ， 那 就 是 CVS 具 备 在 不 事先 挂 载 文件 系统 的 情况 下 跨 网 络 操作 的 能 力 。 

2. 跨 网 络 访问 CVS 

前 面 已 经 介绍 过 ， 你 可 以 通过 为 每 个 命令 加 上 -a 选项 或 设置 环境 变量 cvsRooT 来 告诉 CVS 版 本 库 
所 在 的 位 置 。 如 果 想 跨 网 络 操作 ， 你 只 需要 使 用 这 个 参数 的 一 个 更 高 级 的 语法 即 可 。 例 如 ， 在 写作 本 
书 的 时 候 ，GNOME (GNU 网 络 对 象 模型 环境 ， 一 个 流行 的 开源 图 形 桌 面 系 统 ) 的 开发 源 代码 都 是 通 
过 CVS 系 统 在 因特网 上 访问 的 。 你 只 需 在 路 径 说 明 符 的 前 面 添加 上 一 些 网 络 信息 即 可 指定 正确 的 CVS 
版 本 库 的 位 置 。 

作为 另外 一 个 例子 ， 你 可 以 通过 设置 环境 变量 cvsRooT 为 :pserver:anonymousedev.w3 . 
org:/sources/public， 将 CVS 指 向 Web 标 准 组 织 W3C 的 CVS 版 本 库 。 这 个 设置 告诉 CVS， 该 版 本 库 
使 用 密码 验证 (pserver)， 且 位 于 服务 器 dev.w3.org 上 。 

在 访问 源 代码 之 前 ， 你 需要 先 登 录 ， 如 下 所 示 ; 

$ export CVSROOT= :pserver :anonymousGdev .w3 . org: /sources/public 

$ cvs login 

在 提示 输入 密码 时 输入 anonymous。 

现在 可 以 使 用 cvs 命 令 了 ， 命 令 的 用 法 和 你 对 本 地 版 本 库 进行 操作 时 一 样 ， 只 有 一 个 小 区 别 ， 需 
要 给 每 个 cvs 命 令 加 上 -z3 选 项 以 强制 执行 数据 压缩 ， 这 可 以 节约 网 络 带宽 。 

假设 想 要 获取 W3C HTML 验 证 程序 的 源 代码 ， 使 用 的 命令 是 : 

$ cvs -z3 checkout validator 

如 果 想 把 自己 的 版 本 库 设置 为 可 以 通过 网 络 访问 ， 你 就 需要 在 自己 的 机 器 上 启动 CVS 服 务 。 这 个 
任务 可 以 通过 xinera 或 ineca 来 完成 ， 具 体 使 用 哪个 进程 取决 于 你 的 Linux 系 统 配置 。 对 xineta 来 说 ， 
你 需要 编辑 文件 /etc/xineta.a/cvs 来 反映 CVS 版 本 库 的 位 置 ， 并 使 用 系统 配置 工具 来 激活 和 启动 
cvs 服 务 。 对 ineta 来 说 , 你 只 需 在 文件 /etc/ineta.conf 中 添加 如 下 一 行 语句 , 然后 重启 ineta 即 可 。 

2401 stream tcp nowait root /usr/bin/cvs cvs -b /usr/bin --allow-róot = 

/usr/local/repository pserver 

这 条 语句 告诉 ineta 进 程 为 连接 到 本 机 2401 端 口 的 客户 自动 启动 一 个 Cvs 会话， 端口 2401 是 标准 
的 CVS 服 务 器 监听 端口 。 有 关 如 何 通过 ineta 启 动 网 络 服务 的 更 详细 资料 请 参考 ineta 和 ineta.conf 
的 手册 页 。 

如 果 想 通过 网 络 访问 的 方式 使 用 CVS 版 本 库 ， 你 必须 正确 地 设置 环境 变量 CVsRooT。 例 如 : 

$ export CVSROOT=:pserver:neil@localhost:/usr/local/repository 

目前 为 止 ， 我 们 仅 简 单 介绍 了 CVS 的 功能 。 如 果 想 用 好 CVS 系 统 ， 我 们 强烈 建议 你 设置 一 个 本 地 
版 本 库 来 进行 练习 ， 并 获取 更 全 面 的 CVS 文 档 。 请 记 住 ，CVS 的 源 代码 是 开放 的 ， 如 果 搞 不 懂 代码 的 
作用 和 目的 ， 或 者 《虽然 不 太 可 能 ， 但 确实 有 可 能 !1) 认为 自己 发 现 了 一 个 bug， 你 总 是 可 以 获取 源 代 
码 并 自己 进行 分 析 。CVS 的 主页 是 http://ximbiot.conyevs/cevshome/。 


9.3.5 CVS 的 前 端 程序 


许多 图 形 前 端 程序 可 用 于 访问 CVS 版 本 库 。 网址 htp//www.wincvs.org 提 供 了 可 能 是 最 好 的 多 操作 
系统 前 端 程序 集合 。 该 网 直上 有 用 于 Windows、Macintosh、Linux 系 统 的 客户 端 程序 。 
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图 9-1 


9.3.6 Subversion 


Subversion 旨 在 成 为 开源 社区 中 用 于 强制 替换 CVS 的 版 本 控制 系统 。 根 据 Subversion 主 页 
http://subversion.tigris.org 上 的 说 法 ， 设计 为 一 个 “更 好 的 CVS”。 因 此, 它 具 有 CVS 的 大 多 数 功 能 ， 
并 且 其 接口 的 工作 方式 也 与 CVS 类 似 。 

Subversion 正 变 得 日 益 普及 ， 尤 其 对 于 社区 开发 的 项 目 更 是 如 此 。 因 为 在 这 些 项 目 中 ， 开 发 人 员 
都 是 通过 因特网 来 共同 开发 一 个 应 用 程序 。 大 多 数 Subversion 用 户 都 是 连接 到 一 个 由 开发 项 目的 管理 
员 建 立 的 基于 网 络 的 版 本 库 。 个 人 或 小 团队 的 项 目 使 用 Subversion 的 并 不 多 ，CVS 仍 然 是 他 们 的 首选 
工具 。 

表 9-3 比 较 了 CVS 和 Subversion 中 一 些 完成 同样 功能 的 命令 。 
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cvs Subversion 
cvs -d /usr/local/repository init swnadmin create /usr/local/repository 
cvs import wrox/chap9-cvs svn import cvs-sp file:///usr/local/repository/trunk 
cvs checkout wrox/chap9-cvs 
cvs diff 
cvs rdiff 
cvs update 





cvs commit 


有 关 Subversion 的 完整 文档 见 网 址 http://svnbook. red-bean. com 上 的 在 线 书籍 Version Control 
with Subversion 使 用 Subversion 进 行 版 本 控制 )。 
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如 果 正在 编写 一 个 新 命令 作为 整个 开发 任务 的 一 部 分 ， 你 应 该 为 其 创建 手册 页 。 你 可 能 已 注意 到 ， 
大 多 数 手册 页 的 排版 格式 都 很 相似 ， 它 们 基本 上 都 由 以 下 几 部 分 组 成 : 

O Header (标题 ) 

O Name (名 称 ) 

口 Synopsis (语法 格式 ) 

O Description (说 明 ) 

口 Options (选项 ) 

口 Files (相关 文件 ) 

口 See also (其 他 参考 ) 

O Bugs (已 知 漏洞 ) 

你 可 以 在 手册 页 中 省 去 无 关 部 分 。 Linux 的 手册 页 还 经 常会 在 结尾 出 现 一 个 Author (开发 者 ) 部 分 。 

UNIX 的 手册 页 是 通过 工具 nroff 排 版 的 ， 在 大 多 数 Linux 系 统 中 ， 用 于 完成 相同 功能 的 工具 为 
groff, 它 是 由 GNU 项 目 开发 的 。 这 两 个 工具 都 是 在 早期 的 排版 工具 roff 或 run-off 的 基础 上 开发 的 。 
nroff 或 groff 命 令 的 输入 都 是 纯 文 本 ， 只 是 乍 看 起 来 ， 它们 的 语法 都 显得 非常 上 涩 难 懂 。 但 无 需 紧 
张 ， 在 UNIX 编 程 中 ， 编 写 新 程序 的 -种 最 简单 的 方法 就 是 以 现 有 的 程序 作为 起 点 ， 并 对 其 进行 修改 ， 
编写 手册 页 也 是 一 样 。 

对 groff (或 nroff) 命令 所 使 用 的 各 种 选项 、 命令 和 宏 进行 详细 说 明 超 出 了 本 书 讨论 的 范围 。 
我 们 在 这 里 只 提供 一 个 简单 的 模板 ， 读者 可 以 借鉴 并 写 出 自己 的 手册 页 。 

下 面 是 一 个 用 于 myapp 应 用 程序 的 简单 的 手册 页 的 源 代码 ， 它 位 于 文件 ovapp.1 中 : 

.TH MYAPP 1 

-SH NAME 

Myapp \- A simple demonstration application that does very little. 

.SH SYNOPSIS 

.B myapp 

[N-option ...] 

«SH DESCRIPTION 

Vene pues is a complete application that does nothing useful. 

.PP 





It was written for demonstration purposes. 
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-SH OPTIONS 

.PP 

It doesn't have any, but let's pretend, to make this template complete: 
‘TP 

.BI \-option 

If there was an option, it would not be -option. 

.SH RESOURCES 

-PP 

myapp uses almost no resources. 

.SH DIAGNOSTICS 

The program shouldn't output anything, so if you find it doing so there's 
probably something wrong. The return value is zero. 

.SH SEE ALSO 

The only other program we know with this little functionality is the 
ubiquitous hello world application. 

.SH COPYRIGHT 

myapp is Copyright (c) 2007 Wiley Publishing, Inc. 

This program is free software; you can redistribute it and/or modify 
it under the terms of the GNU General Public License as published by 
the Free Software Foundation; either version 2 of the License, or 
(at your option) any later version. 

This program is distributed in the hope that it will be useful, 

but WITHOUT ANY WARRANTY; without even the implied warranty of 
MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the 

GNU General Public License for more details. 

You should have received a copy of the GNU General Public License 
along with this program; if not, write to the Free Software 
Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA (021111307 USA. 
.SH BUGS 

There probably are some, but we don't know what they are yet. 

.SH AUTHORS 

Neil Matthew and Rick Stones 


正如 你 所 看 到 的 ， 宏 通过 在 一 行 开 头 的 小 数 点 〈.) 引入 ， 并 且 一 般 采 用 缩写 形式 。 第 一 行 结尾 的 
数字 1 表示 这 个 命令 出 现在 手册 页 的 哪个 部 分 。 因 为 命令 出 现在 手册 页 的 第 一 部 分 ， 所 以 这 里 就 是 我 
们 放置 新 应 用 程序 说 明 的 位 置 。 

你 可 以 通过 修改 这 个 样本 或 参考 其 他 命令 的 手册 页 源 代码 来 生成 自己 的 手册 页 。 你 可 能 还 需要 看 
一 下 Linux 的 手册 页 mini-HowTo， 它 由 Jens Schweikhardt 编 写 ， 并 作为 Linux 文 档 项 目的 一 部 分 收录 在 
http://www.tldp.org/ 中 。 

现在 已 经 有 了 手册 页 的 源 代码 ， 你 可 以 用 groff 命 令 来 处 理 它 。groff 命 令 通常 产生 ASCII 文 本 
(-Tascii) 或 PostScript(-Tps)。 你 可 以 用 选项 -man 来 告诉 groff 命 令 生成 手册 页 ， 这 会 让 groff 加 
载 专用 的 手册 页 宏 定义 : 

$ groff -Tascii -man myapp.i 

它 给 出 如 下 的 输出 结果 : 


MYAPP (1) MYAPP (1) 
NAME 








Myapp - A simple demonstration application that does very 
little. 


SYNOPSIS 
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myapp [-option ...] 


DESCRIPTION 
myapp is a complete application that does nothing useful. 


It was written for demonstration purposes. 


OPTIONS 
It doesn't have any, but let's pretend, to make this tem- 
plate complete: 


-option 
1f there was an option, it would not be -option. 


RESOURCES 
myapp uses almost no resources. 


DIAGNOSTICS 
The program shouldn't output anything, so if you find it 
doing so there's probably something wrong. The return 
value is zero. 


SEE ALSO 
The only other program we know with this little func- 
tionality is the ubiquitous Hello World application. 


COPYRIGHT 
myapp is Copyright (c) 2007 Wiley Publishing, Inc. 
This program is free software; you can redistribute it 
and/or modify it under the terms of the GNU General Public 
License as published by the Free Software Foundation; 
either version 2 of the License, or (at your option) any 
later version. 
This program is distributed in the hope that it will be 
useful, but WITHOUT ANY WARRANTY; without even the implied 
warranty of MERCHANTABILITY or FITNESS FOR A PARTICULAR 
PURPOSE. See the GNU General Public License for more 
details. 


1 

MYAPP (1) MYAPP(1) 

You should have received a copy of the GNU General Public 

License along with this program; if not, write to the Free 

Software Foundation, Inc., 59 Temple Place - Suite 330 
Boston, MA 02111-1307, USA 


There probably are some, but we don't know what they are 
yet. 


AUTHORS 
Neil Matthew and Rick Stones 
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现在 你 已 测试 了 手册 页 ， 下 一 步 就 需要 安装 它 。 显 示 手册 页 的 man 命 令 通 过 环境 变量 MANPATH 来 
搜索 手册 页 。 你 可 以 将 新 的 手册 页 放置 到 一 个 本 地 手册 页 目录 中 ， 或 者 将 其 直接 放 到 系统 目录 
/usr/man/man1l 中 。 

当 用 户 第 一 次 要 求 阅读 这 个 手册 页 时 ，man 命 令 将 自动 对 其 进行 排版 并 显示 排版 结果 。 有 些 版 本 
的 man 命 令 还 可 以 自动 生成 并 保存 一 份 预 排版 (还 有 可 能 经 过 压缩 ) 的 ASCII 文 本 版 本 的 手册 页 , 来 加 
速 对 同一 页 面 的 后 续 访问 请 求 的 处 理 。 
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发 行 软件 面临 的 最 主要 问题 是 ， 如 何 确保 已 包含 所 有 必要 的 文件 并 且 它们 都 属于 正确 的 版 本 。 幸 
运 的 是 , 因特网 编程 社区 已 形成 了 一 套 健壮 的 方法 , 非常 有 助 于 解决 这 些 问题 , 这 些 方法 包括 以 下 几 个 。 
口 利用 所 有 UNIX 系 统 都 有 的 标准 工具 将 软件 所 需 的 所 有 文件 打包 为 一 个 单独 的 软件 包 文件 。 
O 控制 软件 包 的 版 本 编号 。 
O 建立 文件 命名 规范 , 在 软件 包 文件 的 名 字 中 包含 版 本 号 ， 从 而 方便 用 户 辨认 他 们 所 使 用 的 软件 
的 版 本 。 
口 在 软件 包 中 使 用 子 目 录 ， 以 确保 从 软件 包 中 提取 的 文件 都 被 放置 到 单独 的 目录 中 ， 这 样 哪些 文 
件 属 于 软件 包 ， 哪 些 不 是 就 一 目 了 然 了 。 
这 些 方法 的 产生 意味 着 软件 的 发 行 工作 能 够 轻松 、 可 靠 地 完成 。 但 软件 的 安装 是 否 容易 则 是 另外 
- 回 事 ， 因 为 这 与 软件 本 身 以 及 准备 安装 它 的 计算 机 系统 有 关 。 但 至 少 你 可 以 确保 软件 包 中 的 所 有 文 
件 都 是 正确 的 。 


9.5.1 patch 程序 


软件 发 行 以 后 ， 用 户 发 现 软件 的 漏洞 或 开发 者 希望 增强 或 升级 软件 的 情况 几乎 是 不 可 避免 的 。 如 
果 开 发 者 以 二 进 制 文件 的 形式 发 行 软 件 ， 他 们 通常 只 会 发 行 新 的 二 进 制 文件 。 有 时 〈 经 常 是 这 样 )， 
厂商 只 是 发 布 程序 的 一 个 新 版 本 ， 而 对 具体 的 修订 情况 以 及 所 做 的 改动 则 一 笔 带 过 。 

另 一 方面 ， 以 源 代码 的 形式 来 发 行 软件 是 个 好 主意 ， 因 为 它 允许 用 户 了 解 你 是 如 何 实现 该 软件 以 
及 如 何 运用 一 些 功能 的 。 它 还 可 以 让 用 户 检查 程序 在 做 什么 , 并 且 允 许 用 户 重用 软件 的 部 分 源 代码 (前 
提 是 他 们 遵守 相关 的 许可 证 协议 )。 

但 是 ， 对 于 Linux 内 核 的 源 代码 来 说 ， 它 在 压缩 之 后 仍然 有 数 十 兆 之 多 ， 包 装 并 传送 一 套 新 版 本 
的 内 核 源 代码 将 消耗 大 量 的 资源 ， 而 事实 上 ， 各 版 本 之 间 可 能 只 有 很 少 一 部 分 的 源 代码 发 生 了 改动 。 

幸运 的 是 ， 我 们 有 一 个 解决 这 一 问题 的 工具 程序 一 patch， 它 由 Larry Wall 编写 ， 他 也 是 Perl 编 
程 语言 的 开发 者 。patch 命 令 允 许 软 件 的 开发 者 只 发 行 定 义 两 个 版 本 之 间 区 别 的 文件 ,这样 无 论 是 谁 ， 
只 要 他 拥有 某 个 文件 的 第 一 个 版 本 和 第 一 个 版 本 与 第 二 个 版 本 之 间 的 区 别 文件 ， 他 就 可 以 用 patch 命 
令 来 自己 生成 该 文件 的 第 二 个 版 本 。 

如 果 你 有 一 个 如 下 文件 的 第 一 个 版 本 : 


This is file one 

line 2 

line 3 

there is no line 4, this is line 5 
line 6 


它 的 第 二 个 版 本 如 下 所 示 : 
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This is file two 
line 2 

line 3 

line 4 

line 5 

line 6 

a new line 8 


你 可 以 使 用 diff 命令 列 出 两 个 版 本 之 间 的 不 同 之 处 : 
$ diff filel.c file2.c > diffs 
Giffs 文 件 的 内 容 如 下 所 示 : 


lcl 

< This is file one 

> This is file two 

Acá, 5 

* there is no line 4, this is line 5 
» line 4 

> line 5 

5a7 

> a new line 8 


这 实际 上 是 一 组 编辑 器 命令 ， 它 们 用 于 将 一 个 文件 修改 为 另 一 个 文件 。 假 设 你 已 经 有 了 文件 
filel.c 和 qiffs， 就 可 以 用 patch 命 令 来 更 新 文件 filel.c， 如 下 所 示 : 


$ patch filel.c diffs 

Hmm... Looks like a normal diff to me... 

Patching file filel.c using Plan A... 

Hunk $1 succeeded at 1. 

Hunk $2 succeeded at 4. 

Hunk #3 succeeded at 7. 

done 

$ 

Patch 命令 将 文件 filel .c 修 改 为 与 tile2.c 一 模 一 样 。 

patch 命 令 还 有 另 一 个 技巧 ， 取 消 补丁 的 能 力 。 假 设 你 不 喜欢 刚才 的 修改 ， 想 将 filel.c 恢 复 为 
原来 的 样子 。 没 问题 ， 你 只 需 再 次 使 用 patch 命 令 ， 不 过 这 一 次 要 使 用 -R( 反 向 补丁 ) 选项 : 

$ patch -R filel.c diffs 

Hmm... Looks like a normal diff to me... 

Patching file filel.c using Plan A... 

Hunk #1 succeeded at 1. 

Hunk $2 succeeded at 4. 

Hunk #3 succeeded at 6. 

done 

$ 

文件 filel.c 将 回 到 它 最 初 的 样子 。 

patch 命 令 还 有 其 他 几 个 选项 ， 但 一 般 情况 下 它 会 根据 输入 的 内 容 来 判断 用 户 想 做 什么 ， 然 后 执 
行 正确 的 操作 。 如 果 patch 命 令 执 行 失败 ， 它 会 创建 一 个 后 组 名 为 .rej 的 文件 ， 在 该 文件 中 将 包含 无 
法 打上 补丁 的 文件 内 容 。 
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在 处 理 软件 的 补丁 时 ， 使 用 aiff 命 令 的 -c 选 项 是 个 好 办 法 。 这 个 选项 的 作用 是 产生 一 个 基于 上 下 
文 的 aiff, 即 提供 每 处 修改 的 前 后 几 行内 容 , 这 样 pacch 命 令 可 以 在 打 补丁 之 前 验证 上 下 文 是 否 匹配 ， 
而 补丁 文件 本 身 也 更 容易 阅读 。 

如 果 你 在 某 个 程序 中 发 现 了 漏洞 并 进行 了 修补 ， 给 程序 的 开发 者 发 送 一 个 补丁 比 仅仅 给 

出 对 修补 的 描述 要 更 容易 、 更 准确 ， 也 更 有 礼 狗 。 
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Linux 的 程序 和 源 代码 通常 以 打包 压缩 文件 的 格式 发 行 ， 在 文件 名 中 包含 软件 的 版 本 号 ， 文 件 的 
后 缕 名 为 .car .gz 或 .cgz， 这 类 文件 通常 也 被 称 为 tarballs 文 件 。 如 果 使 用 的 是 普通 的 ar 命令 ， 则 创 
建 tarballs 文 件 必须 经 过 两 个 步骤 。 下 面 的 命令 将 为 应 用 程序 创建 一 个 打包 压缩 文件 : 

$ tar cvf myapp-1.0.tar main.c 2.c 3.c *.h myapp.1 Makefile5 

main.c 


myapp.l 
Makefiles 


你 现在 有 了 一 个 TAR 文件 ， 如 下 所 示 : 

$ 1s -1 *.tar 

-rw-r--r-- 1 neil users 10240 2007-07-09 11:23 myapp-1.0.tar 

$ 

你 可 以 用 压缩 程序 gzip 对 该 文件 进行 压缩 ， 使 得 其 容量 更 小 : 

$ gzip myapp-1.0.tar 

$ 1s -1 *.gz 

-rw-r--r-- 1 neil users 1648 2007-07-09 11:23 myapp-1.0. tar.gz 

$ 

正如 你 所 看 到 的 ， 最 终 的 文件 容量 被 压缩 的 非常 小 。 你 还 可 以 把 文件 的 后 级 名 .tar .gz 改 为 更 简 
单 的 .tgz， 如 下 所 示 : 

$ mv myapp-1.0.tar.gz myapp vl.tgz 

这 种 以 一 个 小 数 点 和 3 个 字符 结尾 的 文件 命名 方式 看 上 去 像 是 针对 Windows 系 统 的 一 种 妥协 , 因为 
Windows 系 统 不 同 于 Linux 和 UNIX 系 统 ， 它 对 文件 后 组 名 正确 与 否 的 依赖 性 非常 强 。 要 想 再 取 回 文件 ， 
你 需要 先 解压 缩 tar 文 件 ， 再 解 包 ， 从 而 将 文件 释放 出 来 ， 如 下 所 示 ， 

$ mv myapp_v1.tgz myapp-1.0.tar.gz 

$ gzip -d myapp-1.0.tar.gz 

$ tar xvf myapp-1.0.tar 

Hr 


BEA 


8. 
a. 
b. 
e. 
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myapp.l 
MakefileS 
$ 


如 果 使 用 的 是 GNU 版 本 的 car 命令 ， 情 况 将 变 得 更 简单 ， 你 仅 用 一 步 就 可 以 创建 打包 压缩 文件 ， 
如 下 所 示 : 


$ tar zcvf myapp vl.tgz main.c 2.c 3.c *.h myapp.1 Makefile5 
main.c 


myapp.l 
MakefileS 

$ 

同样 ， 解 压缩 操作 也 很 简单 ， 如 下 所 示 


$ tar zxvf myapp vi.tgz 
main.c 

2.c 

he 

a.h 

b.h 

c.h 

myapp.l 

MakefileS 

$ 


如 果 想 在 没有 真正 解压 缩 文件 的 情况 下 了 解 打包 压缩 文件 的 内 容 ， 你 可 以 使 用 tar 命 令 的 另 Ed 
选项 ztvf。 

我 们 在 上 面 的 例子 中 使 用 了 tar 命 令 , 但 对 其 选项 的 描述 仅 限于 例子 中 使 用 的 那些 选项 。 下面 我们 
将 对 该 命令 及 其 常用 选项 做 简单 的 说 明 。 正 如 你 在 上 面 的 例子 中 所 见 ， tar 命 令 的 基本 语法 是 : 

tar [options] [list of files] 

列表 中 的 第 一 项 是 目标 ， 虽 然 我 们 一 直 处 理 的 都 是 文件 ， 但 它 也 可 以 是 一 个 设备 。 列 表 中 的 其 他 
项 将 根据 选项 的 情况 被 添加 到 新 档案 文件 或 已 有 档案 文件 中 。 列 表 中 还 可 以 包含 目录 ， 默 认 情 况 下 ， 
该 目录 中 的 所 有 子 目录 都 将 被 包含 到 档案 文件 中 。 释 放 文 件 并 不 需要 给 出 文件 的 名 字 ， 因为 ar 命令 
将 保留 文件 的 完整 路 径 。 

在 本 节 中 ， 我 们 使 用 了 tar 命 令 的 如 下 6 个 选项 的 组 合 。 

ac 创建 新 档案 文件 。 

Of: 指定 目标 为 一 个 文件 而 不 是 一 个 设备 。 

ü c: 列 出 档案 文件 的 内 容 ， 但 并 不 真正 释放 它们 。 

O v (verbose): 显示 ear 命令 执行 的 详细 过 程 。 

口 x: 从 档案 文件 中 释放 文件 。 

Oz: 在 GNU 版 本 的 tar 命 令 中 用 gzip 命 令 压缩 档案 文件 。 

tar 命 令 还 有 许多 其 他 选项 ， 我 们 可 以 用 这 些 选 项 来 更 好 地 控制 car 命令 的 操作 过 程 及 其 要 创建 的 
档案 文件 。 详 细 资 料 请 参考 rar 命令 的 手册 页 。 
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9.6 RPM 软件 包 


RPM 软件 包 管理 程序 (RPM Package Manager) 或 简称 为 RPM (我 想 你 肯定 喜欢 这 样 一 种 递归 简 
写 的 方式 ) 一 开始 只 是 Red Hat Linux 的 软件 包 格 式 , 它 最 初 的 名 字 为 Red Hat 软 件 包 管理 程序 (Red Hat 
Package Manager)。 从 那 以 后 ，RPM 逐 渐 成 为 许多 其 他 Linux 发 行 版 (包括 SUSE Linux) 所 接受 的 一 种 
软件 包 格式 。Linux 标 准 化 规范 (Linux Standards Base， 简 称 为 LSB) 将 RPM 作为 其 官方 软件 包 格式 ， 
LSB 的 网 址 为 www.linuxbase.org。 
下 面 是 RPM 的 主要 优点 。 
口 使 用 广泛 。 许 多 Linux 发 行 版 至 少 都 可 以 安装 RPM 软件 包 ， 或 者 将 RPM 作为 它 的 标准 软件 包 格 
式 。RPM 还 被 移植 到 许多 其 他 的 操作 系统 中 。 
O 它 能 够 只 用 一 条 命令 来 安装 软件 包 。 你 还 可 以 自动 安装 软件 包 ， 因 为 RPM 就 是 专 为 方便 无 人 
管理 设计 的 。 同 样 ， 删 除 或 升级 软件 包 也 只 需 使 用 一 条 命令 。 
O 只 需要 处 理 一 个 文件 。 一 个 RPM 软件 包 就 保存 在 一 个 单独 的 文件 中 ， 这 使 得 在 不 同系 统 之 间 
传输 软件 包 变 得 非常 容易 。 
口 RPM 自动 处 理 软件 包 之 间 的 依赖 关系 检查 。RPM 系 统 包 含 一 个 数据 库 ， 该 数据 库 中 记录 了 已 
安装 的 所 有 软件 包 的 信息 ， 包 括 每 个 软件 包 所 提供 的 内 容 以 及 安装 每 个 软件 包 的 要 求 。 
O RPM 软件 包 被 设计 为 由 “最 干净 ”的 源 代码 而 来 ， 从 而 可 以 对 它 重 新 编译 。RPM 支 持 如 patch 
这 样 的 Linux 工 具 ， 可 以 在 编译 过 程 中 为 软件 的 源 代码 打上 补丁 。 
9.6.1 使 用 RPM 软件 包 文件 


每 个 RPM 软 件 包 都 存储 在 一 个 以 .rpm 为 后 缀 名 的 文件 中 。 软 件 包 文件 通常 遵循 着 一 种 命名 规范 ， 
它 的 结构 如 下 所 示 : 

name-version-release.architecture.rpm 

在 这 个 结构 中 ，name 指 定 该 软件 包 的 通用 名 称 ， 例 如 对 于 MySQL 数 据 库 来 说 ， 它 就 是 mysql， 对 
于 make 编 译 工具 来 说 ， 它 就 是 make。version 指 定 该 软件 的 版 本 号 ， 例 如 MySQL 的 版 本 5.0.41。 
release 包 含 一 个 数字 ， 它 指定 软件 包 的 RPM 版 本 号 。 这 个 版 本 号 非常 重要 ， 因 为 RPM 软件 包 是 通过 
一 组 指令 建立 的 (我 们 将 在 9.6.3 节 中 介绍 这 方面 的 内 容 ), 你 可 以 通过 zelease 值 来 跟踪 编译 指令 的 改 
动情 况 。 

architecture 指 定 程序 的 架构 ， 例 如 对 于 基于 Intel 的 系统 ， 它 为 1386。 对 于 已 编译 好 的 程序 来 
说 ， 它 非常 重要 ， 例 如 ， 针 对 SPARC 处 理 器 创建 的 可 执行 程序 是 不 能 在 Intel 处 理 器 上 运行 的 。 
architecture 的 值 可 以 是 通用 的 ， 例 如 针对 SPARC 处 理 器 的 sparc， 也 可 以 是 特定 的 ， 例 如 针对 v9 
SPARC 处 理 器 的 sparcv9， 或 针对 AMD Athlon 芯 片 的 athlon。 除 非 你 强制 忽略 它 ， 否 则 RPM 系 统 将 
阻止 安装 来 自 不 同 架构 的 软件 包 。 

如 果 architecture 设 为 一 个 特殊 的 值 noarch， 就 表示 该 软件 包 并 不 针对 某 个 特定 的 架构 ， 例 如 
文档 、Java 程 序 或 Perl 模 块 。 如 果 architecture 设 为 src， 就 表示 该 软件 包 为 RPM 源 代码 软件 包 ， 在 
该 软件 包 中 包含 的 是 源 文件 和 用 于 将 它 编译 为 二 进 制 RPM 软 件 包 的 指令 。 大 多 数 你 可 以 在 网 络 上 找到 
的 RPM 软件 包 都 是 针对 某 个 特定 架构 预 编 译 的 软件 包 ， 这 主要 是 为 了 方便 用 户 的 安装 。 你 可 以 在 网 络 
上 找到 数 千 种 预 编译 好 的 RPM 软件 包 ， 它 们 将 省 去 你 编译 软件 的 麻烦 。 

此 外 ， 一 些 软件 包 的 使 用 非常 依赖 于 某 个 特定 的 Linux 版 本 ， 针 对 这 种 情况 ， 直 接 下 载 一 个 预 编 
译 好 的 软件 包 要 比 手工 测试 所 有 的 软件 包 组 件 要 容易 得 多 .例如 , 曾经 有 一 个 802.11b 无 线 网 络 软 件 包 ， 
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它 是 针对 某 个 特定 的 Linux 发 行 版 的 某 个 特定 内 核 补丁 级 别 预 编译 的 软件 包 ， 比 如 说 它 的 文件 名 为 
kernel-wlan-ng-modules-rh9.18-0.2.0-7-athlon.rpm， 它 包含 的 是 一 个 内 核 模块 ， 针 对 的 用 户 
主机 为 AMD Athlon 处 理 器 的 系统 、Linux 发 行 版 为 RedHat 9.0、 内 核 版 本 为 2.4.20-18。 


9.6.2 安装 RPM 软件 包 
你 用 rpm 命 令 来 安装 RPM 软 件 包 ， 该 命令 的 语法 格式 很 简单 ， 如 下 所 示 : 


rpm -Uhv name-version-release.architecture.rpm 

例如 ; 

$ rpm -Uhv MySQL-server-5.0.41-0.g1ibc23.1386.rpm 

这 个 命令 将 安装 (或 是 升级 ) MySQL 数 据 库 服务 器 软件 包 ， 该 软件 包 针 对 的 是 Intelx86 架 构 的 系 
统 。 

rpm 命 令 还 提供 用 户 与 RPM 系 统 交互 的 能 力 。 你 可 以 用 如 下 命令 查询 某 个 软件 包 是 否 已 安装 ; 


$ rpm -qa xinetd 
xinetd-2.3.14-40 


9.6.3 创建 RPM 软件 包 


你 可 以 用 命令 rpmbuila 来 创建 一 个 RPM 软件 包 。 创 建 的 过 程 相对 而 言 比较 简单 ， 如 下 所 示 。 

口 收集 你 需要 打包 的 软件 。 

O 创建 spec 文 件 ， 该 文件 描述 了 如 何 建立 软件 包 。 

口 用 rpmbuila 命 令 建立 软件 包 。 

由 于 RPM 软件 包 的 创建 可 能 会 非常 复杂 ,为 了 便于 说 明 ， 我 们 在 本 章 中 将 用 一 个 简单 的 例子 来 介 
绍 ， 该 例子 已 足以 说 明 如 何以 源 代码 或 二 进 制程 序 的 方式 来 发 布 一 般 应 用 软件 。 我 们 将 把 更 深奥 的 选 
项 和 通过 打 补丁 的 方式 提供 软件 包 支 持 留 给 有 兴趣 的 读者 来 研究 。 要 想 了 解 更 多 与 rpm 程 序 相关 的 信 
息 ， 请 参考 rpm 程 序 的 手册 页 或 RPM HOWTO 文 档 〈 通 常 可 以 在 /usry/shareydoc 目 录 下 找到 )， 你 
可 以 参考 由 Eric Foster-Johnson 编 写 的 书 《Red Hat RPM 指南 》 (Red Hat Press/Wiley 出 版 )， 该 书 的 在 
版 本 位 于 http://docs.fedoraproject.org/drafts/rpm-guide-en/。 

在 下 面 的 几 小 节 中 ， 我 们 将 按照 上 述 的 3 个 步骤 来 创建 小 应 用 程序 mryapp 的 RPM 软件 包 。 

1. 收集 软件 

创建 RPM 软件 包 的 第 一 步 是 收集 你 需要 打包 的 软件 。 在 大 多 数 情况 中 ,软件 包括 应 用 程序 的 源 代 
码 、 一 个 构建 文件 (如 makefile 文 件 )， 可 能 还 会 有 一 个 在 线 手册 页 。 

将 软件 所 涉及 的 文件 收集 到 一 起 的 最 简单 的 方法 是 将 所 有 相关 文件 打包 到 一 个 tarball 文 件 中 ， 并 
在 该 文件 的 名 字 中 包含 应 用 程序 名 和 版 本 号 ， 例 如 myapp-1.0.tar.gz。 

你 可 以 修改 先前 的 makefile 文 件 Makefile6， 在 其 中 增加 一 个 新 的 目标 ， 将 所 有 文件 打包 到 一 个 
tarball 文 件 中 。 修 改 后 的 makefile 文 件 就 命名 为 Makefile， 如 下 所 示 : 


all: myapp 











# Which compiler 
CC = gcc 


# Where are include files kept 
INCLUDE - . 
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# Options for development 
CFLAGS - -g -Wall -ansi 


* Options for release 
# CFLAGS = -O -Wall -ansi 


# Local Libraries 
MYLIB = mylib.a 


myapp: main.o $(MYLIB) 
$(CC) -o myapp main.o $(MYLIB) 


$ (MYLIB): $(MYLIB)(2.0) $(MYLIB)(3.0) 
main.o: main.c a.h 

2.0: 2.c a.h b.h 

3.0: 3.c b.h c.h 


clean: 
-rm main.o 2.0 3.0 $(MYLIB) 


dist: myapp-1.0.tar.gz 


myapp-1l.0.tar.gz: myapp myapp.l 
-rm -rf myapp-1.0 
mkdir myapp-1.0 
cp *.c *.h *.1 Makefile myapp-1.0 
tar zcvf $6 myapp-1.0 
makefile 文 件 中 的 目标 myapp-1.0.tar.gz 将 为 我 们 的 小 应 用 程序 的 源 代码 创建 一 个 tarball 文 
件 。 为 了 使 用 简便 ， 上 面 的 代码 还 在 makefile 文 件 中 增加 了 一 个 调用 相同 命令 的 aist 目 标 。 你 可 以 
运行 如 下 的 命令 来 创建 tarball 文 件 : 
$ make dist 
接 下 来 ， 你 需要 将 文件 myapp-1.0.car.gz 复 制 到 RPM 的 SOURCES 目 录 中 , 对 于 Red Hat Linux 系 统 
来 说 ， 该 目录 为 /usr/src/redhat/sOURCES; 对 于 SUSE Linux Ub, i% H 3X Jg /usr/src/packages/ 
SOURCES。 执 行 的 命令 如 下 所 示 : 
$ cp myapp-1.0.tar.gz /usr/src/redhat/SOURCES 
RPM 系统 希望 软件 的 源 文 件 以 tarball 文 件 的 形式 放置 在 soURCEs 目 录 中 当然 还 有 其 他 一 些 选 项 ， 
但 这 种 情况 是 最 简单 的 )。sSoURcEs 目 录 只 是 RPM 系统 所 需要 查找 的 几 个 目录 之 一 。 
RPM 系统 需要 5 个 目录 的 支持 ， 它 们 列 在 表 9-4 中 。 








表 94 
RPM 目录 m iè 
suno rpmbuild 命 令 在 这 个 目录 中 建立 软件 
RPMS rpmbuila 命 令 把 它 创建 的 二 进 制 RPM 软 件 包 存放 在 这 个 目录 中 
SOURCES 你 应 该 将 应 用 程序 的 源 文件 存放 在 这 个 目录 中 
es 你 应 该 为 每 个 准备 建立 的 RPM 软 件 包 在 这 个 目录 中 放置 对 应 的 spec 文 件 ， 但 这 并 不 是 必需 的 
SRPMS rpmbuild 命 令 将 在 这 个 目录 中 放置 RPM 源 代码 软件 包 
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在 RPMS 目 录 下 通常 会 有 一 组 针对 不 同 主机 架构 的 子 目录 ,例如 在 一 个 Intelx86 架 构 的 系统 中 , RpMs 


目录 中 的 内 容 如 下 所 示 
$ 1s RPMS 
athlon 
i386 
i486 
i586 
i686 
noarch 


默认 情况 下 ，Red Hat Linux 系 统 期 望 在 /usr/src/reahat 目 录 中 创建 RPM 软件 包 。 


这 个 目录 是 特定 于 Red Hat Linux 的 。 其 他 Linux 发 行 版 会 使 用 其 他 的 目录 ， 例 如 /usr/src/ 
packages. 


- 且 收 集 好 RPM 软件 包 所 需 的 所 有 源 文件 ， 下 一 步 就 是 创建 spec 文 件 ， 该 文件 告诉 rpmbui la 命令 

如 何 正 确 地 建立 软件 包 。 

2. 创建 RPM Spec 文 件 

创建 spec 文 件 可 能 会 非常 让 人 蝴 惧 ， 因 为 RPM 系统 支持 的 选项 数 以 千 计 。 幸 运 的 是 ，RPM 系 统 为 
大 多 数 选项 提供 了 合理 的 默认 值 。 在 本 小 节 中 所 介绍 的 这 个 简单 例子 中 的 内 容 ， 应 该 能 满足 你 将 要 创 
建 的 大 多 数 软件 包 的 需要 了 。 此 外 ， 你 还 可 以 从 其 他 的 spec 文 件 中 复制 你 所 需要 的 命令 。 

关于 spec 文 件 的 更 丰富 的 资源 可 以 从 其 他 的 RPM 软 件 包 中 找到 。 你 可 以 安装 以 .src. rpm 

为 后 组 名 的 RPM 源 代码 软件 包 ， 并 查看 其 中 的 spec 文 件 ， 你 会 发 现 比 你 所 需要 的 还 要 复杂 许 

多 的 例子 ， 例 如 在 软件 包 anonftp、telnet、 vnc 和 sendmail 中 的 spec 文 件 都 是 一 些 比较 有 

趣 的 例子 。 

此 外 ，RPM 系 统 的 设计 者 很 聪明 地 未 在 自己 的 系统 中 开发 另 一 套 工具 来 取代 常用 的 编译 工具 ， 如 
make 或 configure， 而 是 在 系统 中 包含 了 许多 短小 的 功能 来 利用 makefile 和 configure 脚 本 文件 。 

在 本 例 中 ， 你 将 为 myapp 应 用 程序 创建 一 个 spec 文 件 myapp .spec。 该 文件 的 开头 是 一 组 名 字 、 版 
本 号 以 及 与 软件 包 有 关 的 其 他 信息 的 定义 ， 如 下 所 示 : 





Vendor: Wrox Press 
Distribution: Any 

Name: myapp 

Version: 1.0 

Release: 1 

Packager: neiléprovider.com 

License: Copyright 2007 Wiley Publishing, Inc. 
Group: Applications/Media 


RPM spec 文 件 中 的 这 部 分 内 容 常 被 称 为 导言 。 在 上 面 的 导言 中 ， 最 重要 的 定义 是 Name、vVersion 
和 Release。 它 们 在 本 例 中 分 别 被 定义 为 myapp、1.0 和 1， 其 中 RPM 软 件 包 的 版 本 release) 为 1 是 因 
为 这 是 你 第 一 次 尝试 建立 它 。 

Group 定 义 的 作用 是 帮助 图 形 化 安装 程序 将 数 千 种 Linux 应 用 程序 分 类 显示 。Distribution 定 义 
软件 的 发 行 方式 ， 当 你 只 是 针对 某 一 个 Linux 发 行 版 《如 Red Hat 或 SUSE Linux) 建立 软件 包 时 ， 它 的 
定义 就 显得 非常 重要 了 。 

在 spec 文 件 中 添加 注释 是 个 好 主意 。 如 同 shell 脚 本 和 makefile 文 件 ， rpmbuild 命 令 把 在 该 文件 中 
以 字符 # 开 头 的 行 看 作为 注释 ， 例 如 : 
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* This line is a comment.. 

为 了 帮助 用 户 判断 是 否 需 要 安装 你 的 软件 包 ， 你 可 以 在 spec 文 件 中 提供 summary (软件 的 摘要 ) 
和 sdescription (软件 的 描述 )， 注 意 上 述 两 个 定义 在 语法 上 的 不 一 致 ， 在 aescription 的 前 面 有 一 
个 百 分 号 $8。 例 如 ， 你 可 以 按 如 下 方式 描述 你 的 软件 包 : 

Summary: Trivial application, 

%description 

MyApp Trivial Application 

A trivial application used to demonstrate development tools. 

This version pretends it requires MySQL at or above 3.23. 

Authors: Neil Matthew and Richard Stones 

%description 的 定义 可 以 持续 多 行 ( 通 常 也 是 如 此 )。 

spec 文 件 可 以 包含 软件 依赖 关系 的 信息 ， 这 包括 两 方面 的 内 容 ， 软 件 包 提供 了 什么 和 软件 包 依赖 
什么 《你 还 可 以 定义 源 代码 软件 包 依赖 什么 ， 例 如 指定 编译 软件 时 所 需要 的 特定 头 文件 )。 

Provides 定 义 了 软件 包 所 提供 的 功能 ， 例 如 : 

Provides: goodness 

上 面 这 条 语句 声明 软件 包 定义 了 一 个 假想 的 功能 goodness。 如 果 没 有 在 spec 文 件 中 定义 
Provides, 则 RPM 系统 会 自动 添加 Provides 定 义 , 它 的 值 为 软件 包 的 name 定 义 , 在 本 例 中 就 是 myapp。 
当 有 多 个 软件 包 提供 相同 的 功能 时 ，Provides 定 义 就 非常 有 用 。 例 如 ，Apache Web 服 务 器 软件 包 提 
供 的 功能 是 webserver， 而 其 他 的 软件 包 如 Thy， 它 可 能 也 提供 完全 相同 的 功能 。 为 了 帮助 处 理 软件 
包 之 间 的 冲突 ，RPM 还 允许 指定 conflicts MHR) 和 obsoletes (过 时 ) 信息 。 

可 能 最 重要 的 依赖 关系 信息 就 是 Reauires 定 义 .你 可 以 通过 它 定义 软件 包 正常 运行 所 需 的 所 有 其 
他 软件 包 。 例 如 ，Web 服 务 器 需要 网 络 和 安全 软件 包 的 支持 。 在 本 例 中 ， 你 定义 Reauires 为 MySQL 
数据 库 ， 版 本 要 在 3.23 及 其 以 上 。 它 的 语法 如 下 所 示 : 


Requires: mysql >= 3.23 
如 果 只 需要 MySQL 数 据 库 的 支持 ， 但 版 本 不 限 ， 那 么 可 以 使 用 如 下 定义 ; 
Requires: mysql 


如 果 需 要 的 软件 包 未 安装 ，RPM 将 阻止 用 户 安装 该 软件 包 。 当 然 ， 用 户 也 可 以 强制 安装 。 

RPM 系 统 还 将 根据 情况 自动 添加 一 些 依赖 关系 定义 ， 如 针对 shell 脚 本 的 /bin/sh、 针 对 Perl 脚 本 
的 Perl 解 释 程序 和 应 用 程序 需要 调用 的 任何 共享 函数 库 ( 后 组 名 为 .so 的 文件 )。RPM 系 统 的 每 个 新 版 
本 都 会 为 自动 依赖 关系 检查 添加 更 多 的 智能 。 

定义 完 需求 后 ， 你 需要 定义 构成 应 用 程序 的 源 文件 。 对 于 大 多 数 应 用 程序 来 说 ， 你 只 需 将 下 面 的 
定义 复制 到 自己 的 spec 文 件 中 即 可 : 

Source: *(name)-$(version).tar.gz 

#ftname] 语 法 指向 一 个 PM 宏 ， 在 本 例 中 ， 它 指 的 是 软件 包 的 名 称 。 因 为 你 在 前 面 将 name 定 义 为 
myapp， 所 以 rpmbuild 命 令 将 把 $8{name} 扩 展 为 myapp， 同 样 ，%${version} 将 被 扩展 为 1.0， 这 样 完整 
的 文件 名 就 是 myapp-1.0.tar.gz。rpmbuild 命 令 将 在 前 面 提 到 过 的 soURcEs 目 录 中 查找 这 个 文件 。 

这 个 例子 设置 了 一 个 Buildroot， 它 定义 了 一 个 用 于 测试 安装 的 目录 。 你 可 以 将 下 面 的 语句 复制 
到 自己 的 spec 文 件 中 : 
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Buildroot: &( tnppath) /$ (name)-$(version)-root 

设置 好 Builarootc 后 ， 你 就 可 以 将 应 用 程序 安装 到 Builaroot 定 义 的 目录 中 了 。 你 可 以 使 用 变量 
SRPM_BUILD_ROOT 来 引用 它 ， 该 变量 可 以 在 spec 文 件 中 的 所 有 shell 命 令 中 使 用 。 

在 定义 了 所 有 这 些 与 软件 包 相 关 的 设置 后 ， 下 一 步 就 是 定义 如 何 建立 软件 包 了 。 建 立 过 程 一 共 分 
为 4 个 主要 的 部 分 : sprep、sbuilda、sinstal1 和 sclean。 

顾名思义 ，%prep 部 分 用 于 完成 准备 工作 。 在 大 多 数 情况 下 ， 你 可 以 运行 宏 ssetup， 使 用 -q 参 数 
可 以 将 其 设置 为 安静 模式 ， 如 下 所 示 ; 

Sprep 

*setup -q 

sbuild 部 分 用 于 建立 应 用 程序 。 在 大 多 数 情况 下 ， 你 只 需要 使 用 make 命 令 ， 如 下 所 示 :; 

Sbuild 

make 

这 实际 上 就 是 RPM 系统 利用 你 先前 创建 makefile 文 件 所 做 工作 的 一 种 方式 。 

$install 部 分 用 于 安装 应 用 程序 、 手 册页 和 其 他 支持 文件 ,你 通常 可 以 使 用 RPM 宏 4makeinstall 
来 安装 程序 , 它 将 调用 在 makefile 文 件 中 定义 的 install 目 标 , 但 在 本 例 中 , 为 了 显示 更 多 的 RPM 宏 ， 
你 将 手工 安装 所 有 的 文件 ， 如 下 所 示 : 

install 

mkdir -p $RPM BUILD ROOT(. bindir) 

mkdir -p $RPM BUILD ROOT$( mandir) 

install -m755 myapp $RPM BUILD ROOTS(. bindir)/myapp 

install -m755 myapp.1 $RPM BUILD ROOTA( mandir)/myapp.1 

这 个 例子 在 需要 的 情况 下 将 创建 相应 的 目录 ， 然 后 安装 可 执行 程序 myapp 和 手册 页 myapp.1。 环 
境 变量 SRPM_BUILD_RooT 包 含 先前 定义 的 Buildroot 的 值 。 宏 s{_binair) 和 sf_mandir) 将 分 别 被 扩 
展 为 当前 二 进 制程 序 目录 和 手册 页 目录 。 

如 果 用 configure 脚 本 来 创建 makefile 文 件 ， 所 有 可 变 的 目录 名 都 将 被 正确 地 在 你 的 

makefile 文 件 中 设置 。 所以， 在 大 多 数 情况 下 ， 你 不 需要 像 上 面 例子 那样 ， 手 工地 在 spec 文 

件 中 指定 所 有 的 安装 命令 . 

%clean 目 标 用 于 清理 所 有 由 rpmbuild 命 令 创 建 的 文件 ， 如 下 所 示 : 

Sclean 

rm -rf $RPM_BUILD_ROOT 

在 定义 了 如 何 建立 软件 包 后 ， 你 需要 定义 所 有 需要 安装 的 文件 。 RPM 对 此 要 求 非常 严格 ， 为 了 能 
够 正确 地 跟踪 每 个 软件 包 中 的 每 个 文件 ， 它 也 必须 如 此 。sfiles 部 分 定义 了 需要 包括 进 软件 包 的 所 有 
文件 。 在 本 例 中 ， 你 只 有 两 个 文件 需要 放 在 二 进 制 软件 包 中 发 布 ， 它 们 是 可 执行 程序 myapp 和 手册 页 
myapp.1。 如 下 所 示 : 

&files 

$ ( bindir)/myapp 

3 mandir)/myapp.l 

RPM 系统 可 以 在 软件 包 安装 前 和 安装 后 运行 脚本 程序 。 例 如 ， 如 果 软 件 包 是 一 个 守护 进程 ， 你 可 
能 需要 修改 系统 的 初始 化 脚本 来 启动 该 程序 。 你 可 以 通过 spost 脚 本 来 完成 这 一 任务 。 下 面 是 一 个 非 
常 简单 的 spost 脚 本 的 例子 ， 它 仅 用 来 发 送 一 封 电子 邮件 : 
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tpost 
mail root -s "myapp installed - please register" «/dev/null 


你 可 以 在 服务 器 RPM 的 spec 文 件 中 看 到 更 多 的 spost 脚 本 的 例子 。 
下 面 是 这 个 小 应 用 程序 的 spec 文 件 的 完整 内 容 : 


+ 
# spec file for package myapp (Version 1.0) 


Wrox Press 





ri Any 
Name: myapp 
Version: 1.0 
Release: 1 
Packager: neiléprovider.com 
License: Copyright 2007 Wiley Publishing, Inc. 
Group: Applications/Media 
Provides: goodness 
Requires: mysql »- 3.23 
Buildroot: $( tmppath) /$(name)-$(version)-root 
Source: (name) -$ (version).tar.gz 
Summary: Trivial application 


Sdescription 

MyApp Trivial Application 

A trivial application used to demonstrate development tools. 
This version pretends it requires MySQL at or above 3.23. 
Authors: Neil Matthew and Richard Stones 


*prep 
setup -q 


Sbuild 
make 


install 
mkdir -p $RPM BUILD ROOT$( bindir) 

mkdir -p $RPM BUILD ROOT$( mandir) 

install -m755 myapp $RPM BUILD ROOT$( bindir)/myapp 
install -m755 myapp.l $RPM BUILD ROOTt( mandir)/myapp.l 


$clean 
rm -rf $RPM_BUILD_ROOT 


%post 
mail root -s "myapp installed - please register* </dev/null 


$files 
$ Lbindir)/myapp 
$C mandir)/myapp.l 
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现在 你 已 准备 好 建立 RPM 软件 包 了 。 

3. 使 用 rpmbuila 命 令 建立 RPM 软件 包 

使 用 rpmbuila 命 令 来 建立 软件 包 的 语法 如 下 所 示 : 

rpmbuild -bBuildStage spec, file 

选项 -b 告 诉 rpmbuila 命 令 建 立 一 个 RPM 软件 包 。 附 加 的 选项 Builascage 是 一 个 特殊 的 代码 ， 它 
的 作用 是 告诉 rpmbuila 命 令 在 建立 时 需要 做 到 哪 一 步 。 可 以 使 用 的 选项 如 表 9-5 所 示 。 











表 9-5 
选 项 用 iĝ 
-ba 同时 建立 二 进 制 RPM 软 件 包 和 源 代码 RPM 软件 包 
-bb 只 建立 二 进 制 RPM 软件 包 
-be 程序 ， 但 并 不 制作 完整 的 RPM 软件 包 
-bp 个 二 进 制 RPM 软件 包 做 好 准备 
-bi 创建 二 进 制 RPM 软件 包 并 且 安 装 它 
-bl 检查 RPM 软件 包 中 的 文件 列表 


-bs 只 建立 源 代码 RPM 软件 包 
一 一 E 
如 果 要 同时 建立 二 进 制 和 源 代码 RPM 软 件 包 ， 就 使 用 选项 -ba。 源 代码 RPM 软 件 包 允 许 你 重新 建 
立 二 进 制 RPM 软 件 包 。 
将 RPM 的 spec 文 件 复制 到 正确 的 SouRcEs 目 录放 置 应 用 程序 源 代码 的 目录 )》 中 : 
$ cp myapp.spec /usr/src/redhat/SOURCES 
下 面 显示 了 在 SUSE Linux 系 统 中 建立 软件 包 的 输出 结果 (软件 包 是 通过 目录 /usr/src/ 
packages/SOURCES 建 立 的 ) : 
5 rpmbuild -ba myapp.spec 
Executing (%prep): /bin/sh -e /var/tmp/rpm-tmp.47290 
+ umask 022 
cd /usr/src/packages/BUILD 
cd /usr/src/packages/BUILD 
rm -rf myapp-1.0 
/usr/bin/gzip -dc /usr/src/packages/SOURCES/myapp-1.0.tar.gz 
tar -xf - 
STATUS=0 
'[ 0 -ne 0 7)! 
+ cd myapp-1.0 
** /usr/bin/id -u 
* '[' 100020 ']* 
** /usr/bin/id -u 
+ '[' 1000-0 ']* 
+ /bin/chmod -RE a*rX,u*«w,g-w,o-w 
* exit 0 
Executing($build): /bin/sh -e /var/tmp/rpm-tmp.99663 
* umask 022 
* cd /usr/src/packages/BUILD 
+ /bin/rm -rf /var/tmp/myapp-1.0-root 
** dirname /var/tmp/myapp-1.0-root 
* /bin/mkdir -p /var/tmp 


下 和 
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+ /bin/mkdir /var/tmp/myapp-1.0-root 
* cd myapp-1.0 


* make 
gcc -g -Wall -ansi -c -o main.o main.c 
gcc -g -Wall -ansi -c -o 2.0 2.c 


ar rv mylib.a 2.0 
ar: creating mylib.a 


a - 2.0 
gcc -g -Wall -ansi -c -0 3.0 3.c 

ar rv mylib.a 3.0 

a - 3.0 

gcc -o myapp main.o mylib.a 

* exit 0 

Executing (%install): /bin/sh -e /var/tmp/rpm-tmp.47320 

+ umask 022 

+ cd /usr/src/packages/BUILD 

+ cd myapp-1.0 

+ mkdir -p /var/tmp/myapp-1.0-root/usr/bin 

* mkdir -p /var/tmp/myapp-1.0-root/usr/share/man 

+ install -m755 myapp /var/tmp/myapp-1.0-root/usr/bin/myapp 
+ install -m755 myapp.l /var/tmp/myapp-1.0-root/usr/share/man/myapp.1 
+ RPM BUILD ROOT-/var/tmp/myapp-1.0-root 

+ export RPM, BUILD ROOT 

+ test -x /usr/sbin/Check -a 1000 = 0 -o 


-x /usr/sbin/Check -a '!' -z /var/tmp/myapp-1.0-root 

* echo 'I call /usr/sbin/Check...' 

I call /usr/sbin/Check... 

* /usr/sbin/Check 

-rwxr-xr-x 1 neil users 926 2007-07-09 13:35 
/var/tmp/myapp-1 .0-root//usr/share/man/myapp.1.gz 

Checking permissions and ownerships - using the permissions files 

/tmp/Check.perms.017506 

setting /var/tmp/myapp-l.0-root/ to root:root 0755. (wrong owner/group neil:users) 

setting /var/tmp/myapp-1l.0-root/usr to root:root 0755. (wrong owner/group 

neil:users) 

* /usr/lib/rpm/brp-compress 

+ lusr/lib/rpm/brp-symlink 

Processing files: myapp-1.0-1 

Finding Provides: /usr/lib/rpm/find-provides myapp 

Finding Requires: /usr/lib/rpm/find-requires myapp 

Finding Supplements: /usr/lib/rpm/find-supplements myapp 

Provides: goodness 

Requires(interp): /bin/sh 

Requires(rpmlib): rpmlib(PayloadFilesHavePrefix) <= 4.0-1 
rpmlib(CompressedFileNames) <= 3.0.4-1 

Requires(post): /bin/sh 

Requires: mysql »- 3.23 libc.so.6 libc.so.6(GLIBC 2.0) 

Checking for unpackaged file(s): /usr/lib/rpm/check-files /var/tmp/myapp-l.0-root 

Wrote: /usr/src/packages/SRPMS/myapp-1.0-1.src.rpm 

Wrote: /usr/src/packages/RPMS/i586/myapp-1.0-1.1586.rpm 

Executing(&clean): /bin/sh -e /var/tmp/rpm-tmp.10065 


* umask 022 
+ cd /usr/src/packages/BUILD 国 
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+ cd myapp-1.0 
+ rm -rf /var/tmp/myapp-1.0-root 
+ exit 0 


执行 完 rpmbuila 命 令 后 ， 你 将 看 到 两 个 RPM 软 件 包 在 RPMs 目 录 中 的 二 进 制 RPM 软件 包 ， 该 软 
件 包 放置 在 相应 的 主机 架构 子 目录 中 ， 如 子 目录 RpMs/i586; 在 sRPMs 目 录 中 的 源 代 码 RPM 软 件 包 。 

二 进 制 RPM 软 件 包 的 文件 名 将 类 似 下 面 这 样 : 

myapp-1.0-1.1586. rpm 

文件 名 中 表示 主机 架构 的 部 分 可 能 会 随 着 系统 的 不 同 而 不 同 。 

源 代 码 RPM 软 件 包 的 文件 名 将 类 似 下 面 这 样 ; 

myapp-1.0-1.src.rpm 


你 需要 以 超级 用 户 的 身份 来 安装 软件 包 。 但 在 建立 软件 包 时 ， 你 并 不 需要 root 的 身份 ， 
只 要 你 对 RPM 目录 (通常 是 /usr/src/redhat ) 有 写 权限 即 可 . 一 般 情况 下 ， 你 不 应 该 以 
root 的 身份 来 创建 RPM 软件 包 ， 因 为 spec 文 件 中 可 能 会 包含 对 系统 造成 破坏 的 命令 
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虽然 RPM 是 一 种 流行 的 软件 发 布 方式 , 它 允 许 用 户 控制 软件 的 安装 和 种 载 ， 但 目前 还 有 其 他 儿 种 
具备 竞争 力 的 软件 包 格式 。 一 些 软件 仍然 以 打包 压缩 文件 (tgz)》 的 方式 发 布 ， 这 些 软件 的 通常 安装 
步 野 是 :首先 将 软件 包 释放 到 一 个 临时 目录 中 ， 然 后 运行 一 个 脚本 文件 来 执行 真正 的 安装 。 

Debian 和 基于 Debian 的 Linux 发 行 版 〈 以 及 一 些 其 他 的 Linux 发 行 版 ) 支持 另 -种 软件 包 格式 dpkg， 
它 在 功能 上 和 RPM 类 似 。 它 解 包 和 安装 通常 以 .Gep 为 后 级 的 软件 包 文件 。 如 果 需 要 以 .Geb 软件 包 格式 
来 发 布 软件 ， 你 可 以 用 工具 Alien 将 RPM 软件 包 转 换 为 apkg 格 式 。 有 关 Alien 的 更 多 资料 请 参考 
http;//Kitenet.neUprograms/alien/. 
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目前 为 止 ， 我 们 在 本 章 中 介绍 的 几乎 所 有 工具 基本 上 都 是 命令 行 工具 。 具 有 在 Windows 系 统 上 开 
发 经 验 的 程序 员 毫 无 疑问 都 有 使 用 集成 开发 环境 CIDE) 的 经 历 。 IDE 是 一 个 图 形 化 的 环境 ， 它 通常 会 
将 用 于 创建 、 调 试 和 运行 应 用 程序 的 部 分 或 所 有 工具 集成 到 一 起 。 它 一 般 至 少 会 提供 一 个 编辑 器 、 
个 文件 浏览 器 和 一 种 运行 应 用 程序 并 捕获 其 输出 结果 的 方法 。 更 完整 的 开发 环境 还 会 支持 从 模板 中 为 
特定 类 型 的 应 用 程序 生成 源 代码 文件 ， 集 成 源 代码 控制 系统 和 自动 生成 文档 。 

在 下 面 几 节 中 ， 我 们 将 介绍 KDevelop 及 其 他 一 些 可 在 Linux 上 运行 的 IDE。 这 些 IDE 都 正 处 于 积极 
的 开发 过 程 中 ， 其 中 一 些 最 高 级 的 IDE 已 具备 与 商业 软件 匹敌 的 质量 。 


9.8.1 KDevelop 
KDevelop 是 用 于 C 和 C++ 程序 的 IDE。 它 对 运行 在 K 桌 面 环境 (KDE) 中 的 应 用 程序 的 开发 提供 特 
别 的 支持 ，KDE 是 当前 Linux 系 统 中 两 大 主流 图 形 用 户 界面 之 一 。KDevelop 还 可 用 于 开发 其 他 类 型 的 
项 目 ， 包 括 简单 的 C 语 言 程序 。 
KDevelop 是 一 个 自由 软件 ， 它 是 根据 GNU 通 用 公共 许可 证 (GPL) 的 条 款 发 布 的 ， 许 多 Linux 发 
行 版 都 提供 了 该 软件 。 你 可 以 从 http://www.kdevelop.org 上 下 载 它 的 最 新 版 本 。 通过 KDevelop 开 发 的 项 
目 在 默认 情况 下 都 遵循 GNU 项 目的 标准 。 例 如 ， 它们 将 使 用 autoconf 工 具 来 生成 makefile 文 件 ， 





























9.8 开发 环境 359 





autocont 将 根据 编译 该 软件 的 系统 环境 来 自动 调整 makefile 文 件 的 内 容 。 这 意味 着 项 目 可 以 以 源 代 
码 的 方式 发 布 ， 并 且 很 有 可 能 能 够 在 其 他 系统 中 编译 通过 。 

使 用 KDevelop 开 发 的 项 目 还 包含 用 于 制作 文档 的 模板 、GPL 许 可 证 文本 和 通用 的 安装 说 明 。 在 制 
作 新 的 KDevelop 项 目 过 程 中 产生 的 大 量 文件 可 能 会 令 使 用 者 非常 旦 惧 , 但 如 果 你 曾经 下 载 并 编译 过 一 
个 典型 的 GPL 应 用 程序 ， 那 么 就 不 会 对 这 些 文件 感到 陌生 了 。 

KDevelop 支 持 CVS 和 Subversion 的 源 代码 控制 , 应 用 程序 可 以 在 不 离开 IDE 环 境 的 情况 下 被 编辑 和 
调试 。 图 9-2 和 图 9-3 显 示 了 编辑 和 执行 一 个 默认 的 KDevelop C 语 言 应 用 程序 〈 这 是 另 一 个 Hello World! 
程序 ) 的 情况 。 
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9.82 ”其 他 开发 环境 


目前 还 有 许多 其 他 的 编辑 器 和 IDE (自由 软件 和 商业 软件 ) 可 以 用 在 Linux 系 统 中 ， 或 正 处 于 开发 
阶段 。 其 中 一 些 比较 有 趣 的 软件 列 在 表 9-6 中 。 











表 96 
开发 环境 类 型 产品 URL 
Eclipse 基于 Java 的 工具 平台 和 IDE http://www.eclipsc.org 
Anjuta 个 GNOME IDE http://anjuta.sourceforge.net/ 
QEZ -个 KDE IDE http:/projects.uid0.sk/qtez/ 
SlickEdit -个 商业 版 本 的 多 语言 代码 编辑 器 http:/www.slickedit.com/ 





9.9 小 结 


在 本 章 中 ， 你 看 到 了 一 些 Linux 开 发 工具 ， 它 们 使 程序 的 开发 和 发 布 更 容易 管理 。 首 先 ， 你 使 用 
make 和 makefile 文 件 来 管理 多 个 源 文件 ， 这 也 是 本 章 最 重要 的 内 容 。 然 后 ， 你 学 习 了 如 何 通过 RCS 
和 CVS 来 控制 源 代码 ， 它 们 可 以 让 你 在 开发 代码 的 过 程 中 对 各 种 改动 进行 跟踪 。 接 下 来 ， 你 学 习 了 如 
何 通过 parch 命 令 、 带 有 gzip 压 缩 功能 的 ar 命令 和 RPM 软件 包 来 发 布 软件 。 最 后 ， 你 学 习 了 一 个 IDE 
[ 具 KDevelop， 它 可 以 让 编辑 一 运行 一 调试 这 个 开发 周期 变 得 更 容易 一 些 。 








据 美国 软件 工程 学 会 和 IEEE 的 研究 ， 每 个 重要 的 软件 最 初 都 会 有 缺陷 。 一 般 来 说 ， 每 100 

行 代码 会 有 两 个 左右 的 错误 。 这 些 错误 将 导致 程序 和 函数 库 无 法 按照 需要 的 方式 执行 ， 这 
通常 会 造成 程序 的 实际 执行 情况 和 预期 的 情况 不 同 。 在 软件 开发 过 程 中 ， 查 找 、 识 别 和 纠正 这 些 错误 
将 耗费 程序 员 大 量 的 时 间 。 

在 本 章 中 ， 我 们 将 研究 软件 的 缺陷 ， 并 介绍 一 些 工 具 和 技术 来 捕捉 错误 行为 的 特定 实例 。 这 与 程 
序 测试 〈 以 各 种 可 能 出 现 的 条 件 来 检验 程序 操作 情况 ) 是 不 同 的 ， 虽 然 测 试 和 调试 密切 相关 ， 并 且 许 
多 错误 正 是 在 测试 阶段 被 发 现 的 。 

在 本 章 中 ， 我 们 将 介绍 下 面 一 些 主题 : 

口 错误 类 型 

口 常用 调试 技巧 

口 使 用 GDB 和 其 他 工具 进行 调试 

口 断言 

口 内 存 调 试 


10.1 错误 类 型 


有 几 种 原因 会 造成 程序 的 缺陷 ， 针 对 每 种 原因 ， 我 们 都 有 下 面 一 些 建议 的 方法 用 来 查找 和 纠正 。 

O 功能 定义 错误 : 如 果 程 序 的 功能 被 错误 地 定义 了 ， 它 就 肯定 不 能 完成 预定 的 工作 。 即 使 是 世界 
上 最 优秀 的 程序 员 ， 有 了 时 也 会 写 出 错误 的 程序 。 所以， 在 开始 程序 设计 (或 规划 ) 之 前 ， 你 必 
须 确 认 自己 知道 并 理解 这 个 程序 究竟 是 用 来 干什么 的 。 认真 分 析 用 户 需 求 并 加 强 和 用 户 之 间 的 
沟通 ， 有 助 于 查找 和 纠正 许多 (即使 不 是 全 部 ) 程序 功能 定义 方面 的 错误 。 

O 设计 规划 错误 : 无 论 程序 规模 的 大 小 ,在 创建 它们 之 前 都 需要 设计 规划 ,在 计算 机 键盘 前 坐 下 ， 
直接 蔽 入 源 代码 ,然后 期 望 程序 能 一 次 通过 ， 这 样 的 情况 并 不 常见 。 对 程序 员 来 说 ,一定 要 多 
花 点 时 间 思 考 ， 如 何 构造 程序 ， 需 要 什么 样 的 数据 结构 ， 它 又 应 该 如 何在 程序 中 使 用 。 尽 量 把 
这 些 细节 问题 提前 确定 下 来 ， 这 样 将 节省 今后 很 多 改写 代码 的 时 间 。 

O 代码 编写 错误 : 当然 , 每 个 人 都 会 出 现 键入 错误 。 根据 设计 来 创建 源 代码 的 过 程 并 不 是 一 个 不 
会 出 错 的 完美 过 程 ， 许 多 程序 错误 都 是 在 这 一 阶段 悄悄 潜入 的 。 在 程序 中 遇 到 错误 时 ， 要 
重新 阅读 源 代 码 或 与 其 他 人 进行 探讨 ， 这 个 办 法 虽然 因为 简单 而 容易 被 人 忽视 ， 但 它 却 非 
常 有 效 。 你 肯定 会 对 自己 通过 与 他 人 探讨 程序 的 具体 实现 而 能 够 查找 并 纠正 的 错误 之 多 感 
到 惊讶 。 
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像 C 语 言 这 样 带 有 编译 器 的 程序 设计 语言 有 一 个 优点 ， 它 的 语法 错误 可 以 在 编译 阶段 检 

查 出 来 。 而 对 于 解释 型 的 语言 ， 如 Linux shell， 则 只 能 在 程序 的 运行 阶段 才能 发 现 语法 错误 。 

如 果 问 题 出 在 程序 的 错误 处 理 代码 部 分 ， 则 即使 在 程序 的 测试 阶段 ， 也 不 容易 发 现 它 . 

O 可 以 试 着 在 纸 上 执 行程 序 的 核心 代码 ， 这 个 过 程 通常 被 称 为 空运 行 dry running)。 针 对 那些 
非常 重要 的 例 程 ， 先 记 下 它们 的 输入 值 ， 然 后 逐步 手工 计算 出 输出 结果 。 调 试 程序 并 不 一 定 非 
要 用 计算 机 不 可 ， 有 时 ， 问 题 可 能 正 是 因为 计算 机 本 身 才 出 现 的 。 即 使 是 编写 函数 库 、 编 译 器 
和 操作 系统 的 程序 员 也 会 犯错 误 。 可 话 又 说 回来 ， 也 不 要 一 出 问题 就 抱怨 工具 ， 新 程序 出 现 错 
误 的 可 能 性 要 比 编译 器 大 得 多 。 


10.2 ”常用 调试 技巧 


目前 有 几 种 典型 的 调试 和 测试 Linux 程 序 的 方法 。 一 般 做 法 是 先 运行 程序 并 观察 其 输出 结果 ， 
果 不 能 正常 工作 ， 我 们 就 需要 决定 应 该 采取 哪些 措施 。 可 以 修改 程序 然后 重新 尝试 (代码 检查 - 试 运 
行 -出 错 法 )， 也 可 以 在 程序 中 增加 一 些 语句 来 获得 更 多 关于 程序 内 部 运行 情况 的 信息 取样 法 )， 还 
可 以 直接 检查 程序 的 执行 情况 〈 受 控 执行 法 )。 程 序 调试 可 以 分 为 如 下 5 个 阶段 。 

口 测试 ， 找 出 程序 中 存在 的 缺陷 或 错误 。 

O 固化 ， 让 程序 的 错误 可 重 现 。 

口 定位 :确定 相关 的 代码 行 。 

Q 纠正 :修改 代码 纠正 错误 。 

口 验证 ， 确 定 修改 解决 了 问题 。 
10.2.1 有 漏洞 的 程序 

我 们 先 来 看 一 个 有 漏洞 的 示例 程序 。 在 本 章 中 ， 我 们 将 对 其 进行 调试 。 这 个 程序 是 在 某 大 型 软件 
系统 的 开发 过 程 中 编写 的 ,其 作用 是 测试 函数 sort， 该 函数 的 功能 是 通过 冒 泡 排 序 算法 对 一 个 类 型 为 
item 的 结构 数组 进行 排序 ， 具 体 的 排序 方法 为 基于 结构 中 的 成 员 key 以 升序 排列 数组 成 员 。 程 序 用 一 
个 样本 数组 来 测试 函数 sort。 在 现实 中 ,我 们 可 能 永远 也 不 会 使 用 这 个 算法 ， 因 为 它 的 执行 效率 实在 
太 低 了 。 在 这 里 使 用 这 个 算法 的 原因 在 于 它 比较 短小 ， 相 对 来 说 简单 易 懂 ， 而 且 也 更 容易 出 错 。 事 实 
上 ， 在 标准 的 C 函 数 库 中 已 经 有 一 个 完成 同样 功能 的 函数 asort 了 。 

精 料 的 是 ， 这 个 程序 的 可 读 性 比较 差 ， 里 面 没 有 任何 注释 ， 也 不 知道 最 初 的 程序 员 是 哪 一 位 ， 所 
以 一 切 只 能 靠 我 们 自己 了 。 先 从 基本 的 例 程 ebug1.c 开 始 ， 下 面 是 该 文件 的 内 容 : 

/* 1 */ typedef struct ( 











JI 2 char *data; 
de aey int key, 

/*. 4 */ ) item; 

Pu NUn 

/* 6 */ item array[] = 

OU IRA {"bill", 3 

JB. (*neil*, 4), 
509 nM (*john*, 2), 
ze 30 8 (rick*, 5), 


PEOR (alex, 1), 
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/* 14 */ sort(a,n) 
J 15 -*/ irem fa; 


j = 0; 





=0, 
VESTRE int s = 1; 


4X3 80 «4 for(; i« n & s != 0; i++) ( 

J* 33. */ s-0; 

y* 22 */ for(j = 0; j < n; j++) ( 

md if(aljl.key > a[lj+1] .key) { 
1 24 */ item t = alj]; 

p a5 ct alj) = alj*1]; 

/* 26 */ alj+1] = t; 

pot - A S++; 


y* 30 s n--; 


[$433 f 

/* 34 */ main() 

J*.85 *; ( 

41:,36. "J. sort(array,5); 

eer MAE 

我 们 来 编译 这 个 程序 : 

$ cc -o debugl debugl.c 

编译 过 程 很 顺利 ， 既 无 出 错 信息 也 无 警告 信息 。 

运行 这 个 程序 之 前 ， 我 们 需要 在 程序 中 添加 一 些 代码 来 打印 出 结果 ， 否 则 就 不 会 知道 这 个 程序 是 
WET o 这 些 代码 的 作用 是 显示 排序 后 的 数组 。 我 们 将 这 个 新 版 本 的 文件 命名 为 aebug2.c， 如 


| mi 





/* 33 */ #include <stdio.h> 
/* 34 */ main() 


8036 x int i; 

285437 4 sort(array,5); 

p*38 好 for(i = 0; i < 5; i++) 

1* 39 */ printf ("array[%d] = (3s, $d)Wn*, 

VA, 260. C8? i, array[i].data, array[i].key); 


严格 来 说 ， 这 些 额外 的 代码 并 不 属于 程序 员 的 职责 范围 ， 加 上 它 完全 是 因为 测试 工作 的 需要 。 添 
加 这 些 代码 时 ， 我 们 必须 非常 小 心 以 避免 在 测试 代码 中 引入 新 的 漏洞 。 现 在 ， 再 次 编译， 然后 运行 
程序 : 

$ cc -o debug2 debug2.c 

$ ./debug2 

这 样 做 产生 的 输出 结果 取决 于 你 所 使 用 的 Linux (或 UNIX) 版 本 及 其 具体 设置 情况 。 在 我 的 系统 
上 运行 它 时 ， 得 到 的 输出 结果 是 : 

array[0] = (john, 2) 

array[1] = (alex, 1) 
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array[2] = ((null), -1) 
array[3] = (bill, 3) 
array[4] = (neil, 4) 


但 它 在 本 书 另 一 位 作者 的 系统 《运行 的 是 另 一 个 版 本 的 Linux 内 核 )》 上 运行 时 ， 给 出 的 输出 却 是 
这 样 : 

Segmentation fault 

在 你 的 Linux 系 统 中 运行 这 个 程序 时 ， 你 可 能 会 看 到 其 中 一 种 输出 结果 ， 或 者 完全 不 同 的 另外 一 
个 输出 结果 。 而 我 们 希望 看 到 的 输出 是 : 


array[0] = (alex, 1) 
array[1] - (john, 2) 
array[2] = (bill, 3) 
array[3] = (neil, 4) 
array[4] - (rick, 5) 


很 明显 ， 这 段 代码 存在 着 很 严重 的 问题 。 即 使 它 能 运行 ， 给 出 的 排序 结果 也 是 错误 的 。 如 果 它 的 
运行 产生 段 错误 Csegmentation fault) 而 被 终止 ， 就 说 明 操作 系统 向 程序 发 送 了 一 个 信号 ， 告 诉 程序 
操作 系统 检测 到 了 非法 的 内 存 访问 ， 为 防止 内 存 空间 被 破坏 ， 操 作 系统 提前 终止 了 该 程序 的 运行 。 

操作 系统 检测 非法 内 存 访问 的 能 力 ， 取 决 于 它 的 硬件 配置 和 它 在 内 存 管理 实现 方面 的 一 些 具体 做 
法 。 在 大 多 数 系统 中 ， 操 作 系统 分 配给 程序 的 内 存 一 般 都 会 比 程序 实际 需要 使 用 的 大 一 些 。 如 果 非 法 
内 存 访问 出 现在 这 部 分 内 存 区 域内 ， 硬 件 就 可 能 检测 不 到 ， 这 就 是 并 非 所 有 版 本 的 Linux 和 UNIX 系 统 
都 会 产生 段 错 误 的 原因 。 

有 的 库 函 数 (比如 printf ) 在 某 些 特殊 情况 下 ( 比如 使 用 了 一 个 空 指针 ) 也 会 阻止 非法 
访问 操作 的 发 生 。 


如 果 想 捕捉 到 数组 访问 方面 的 错误 ， 最 好 增加 数组 元 素 的 大 小 ， 因 为 这 样 同时 也 增加 了 错误 的 大 
小 。 如 果 只 是 在 数组 的 结尾 之 后 读 取 一 个 字 节 ， 我 们 很 可 能 会 看 不 到 有 错误 发 生 ， 因 为 分 配给 程序 的 
内 存 大 小 会 取 整 到 操作 系统 的 特定 边界 ， 一 般 分 配 的 内 存 大 小 以 8K 为 单位 递增 。 

如 果 增 加 数组 元 素 的 大 小 ， 比 如 在 此 例 中 将 icem 结 构 中 的 成 员 aata 扩 大 为 一 个 可 以 容纳 4 096 个 
字符 的 数组 ， 对 不 存在 的 数组 元 素 进行 访问 时 ， 内 存 地 址 就 有 可 能 落 在 分 配给 这 个 程序 的 内 存 之 外 
的 地 方 。 因 为 数组 的 每 个 元 素 大 小 为 4K， 所 以 我 们 错误 使 用 的 内 存 将 落 在 数组 结尾 之 后 的 OK 一 4K 范 
围 内 。 

如 果 这 样 做 ， 并 将 修改 后 的 程序 命名 为 aebug3 .c， 它 将 在 两 位 作者 的 Linux 系 统 上 都 产生 段 错误 。 
如 下 所 示 : 








Ee wan char data[4096]; 
$ cc -o debug3 debug3.c 
$ ./debug3 


Segmentation fault 

但 还 是 存在 着 这 样 的 可 能 性 ， 即 某 些 Linux 或 UNIX 版 本 仍然 不 会 产生 段 错误 。 当 C 语 言 的 ANSI 标 
准将 某 种 行为 定义 为 “未 定义 ”时 ， 实 际 上 它 还 是 允许 程序 运行 的 。 现 在 看 来 ， 我 们 所 写 的 这 个 C 语 
言 程序 是 不 合 规范 的 ， 而 且 这 个 不 合 规范 的 C 语 言 程序 可 能 会 表现 出 非常 奇怪 的 行为 ! 我 们 将 看 到 这 
个 错误 确实 就 属于 刚才 所 说 的 “未 定义 ”行为 的 范畴 。 
10.22 ”代码 检查 

先前 已 经 提 到 过 ， 当 程序 的 运行 情况 和 预期 不 同时 ， 最 好 重新 阅读 程序 。 根 据 本 章 的 学 习 目 的 ， 
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我 们 假设 程序 代码 已 经 被 检查 过 ， 那 些 比较 明显 的 错误 也 都 已 经 被 排除 了 。 
代码 检查 这 一 术语 还 用 于 一 种 更 加 正式 的 场合 : 一 组 开发 人 员 逐 字 逐 句 的 检查 数 百 行 的 
代码 . 但 代码 本 身 的 规模 大 小 其 实 并 不 重要 , 它 仍然 是 代码 检查 并 且 是 一 个 非常 有 用 的 技巧 。 
有 些 工具 可 以 帮助 你 完成 代码 检查 工作 , 编译 器 就 是 其 中 比较 明显 的 一 个 。 如 果 程序 有 语法 错误 ， 
它 就 会 告诉 你 。 


有 些 编译 器 还 有 用 来 针对 可 疑 行为 产生 报警 的 选项 ， 比 如 未 对 变量 进行 初始 化 、 在 条 
件 判 断 里 使 用 赋值 操作 等 。 举例 来 说 ，GNU 编 译 器 在 运行 时 可 以 使 用 下 面 这 些 选项 . 











gcc -Wall -pedantic -ansi 


这 些 选项 将 启用 许多 警告 和 其 他 检查 来 检验 程序 是 否 符合 C 语 言 标准 。 我们 建议 大 家 养 

成 使 用 这 些 选项 的 习惯 ， 特 别 是 -Wal1 选 项 。 在 追踪 程序 的 错误 时 ， 它 可 以 产生 非常 有 用 的 

信息 。 

我 们 将 在 稍 后 介绍 lint 和 splint 等 工具 。 与 编译 器 一 样 ， 它 们 对 源 代 码 进 行 分 析 并 报告 可 能 不 
正确 的 代码 。 
10.23 ”取样 法 

取样 法 是 指 在 程序 中 添加 一 些 代码 以 收集 更 多 与 程序 运行 时 的 行为 相关 的 信息 的 方法 。 取 样 法 的 
常见 做 法 是 ,在 程序 中 添加 printf 函 数 调用 以 打印 出 变量 在 程序 运行 的 不 同 阶段 的 值 ， 如 同 我 们 在 上 
面 的 例子 中 所 做 的 那样 。 我 们 可 以 添加 多 个 printf 函 数 调用 , 但 需要 注意 , 无 论 何 时 程序 发 生 了 改动 ， 
这 一 过 程 都 将 带 来 更 多 的 编辑 和 编译 次 数 ， 而 且 ， 在 程序 错误 被 修复 后 ， 我 们 还 要 把 这 些 额外 的 代码 
删除 掉 。 

在 这 里 可 以 使 用 两 种 取样 法 的 技巧 。 第 一 种 技巧 是 用 C 语 言 的 预 处 理 器 有 选择 地 包括 取样 代码 ， 
这 样 只 需 重新 编译 程序 就 可 以 包含 或 去 除 调试 代码 。 实 现 方法 非常 简单 ， 只 需 使 用 如 下 的 语句 结构 : 

#ifdef DEBUG 

printf('variable x has value = %d\n”, x); 

#endif 

在 编译 程序 时 可 以 加 上 编译 器 标志 -DDEBUG。 如 果 加 上 这 个 标志 ， 就 定义 了 DEBUG 符 号 ， 从 而 可 
以 在 程序 中 包含 额外 的 调试 代码 ， 如 果 未 加 上 该 标志 ， 这 些 调试 代码 将 被 删除 。 我 们 还 可 以 用 数值 调 
试 宏 来 完成 更 复杂 的 调试 应 用 ， 如 下 所 示 : 

$define BASIC_DEBUG 1 


$define EXTRA DEBUG 2 
define SUPER DEBUG 4 


#if (DEBUG & EXTRA DEBUG) 
printf... 
*endif 
在 这 种 情况 下 ， 我 们 必须 总 是 定义 DEBUG 宏 ， 但 我 们 可 以 设置 它 为 代表 一 组 调试 信息 或 代表 一 个 
试 级 别 。 比 如 编译 器 标志 -DDEBUG=5 将 启用 BASIC_DEBUG 和 sUPER_DEBUG, 但 不 包括 EXTRA_ DEBUG. 
标志 -DDEBUG=0 将 禁用 所 有 的 调试 信息 。 另 外 ， 也 可 以 在 程序 中 添加 如 下 语句 。 这 样 ， 当 不 需要 调试 
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时 ， 就 不 必 在 命令 行 上 定义 DeBuc 宏 。 


#ifndef DEBUG 
#define DEBUG 0 
fendif 





预 处 理 器 定义 的 一 些 宏 可 以 帮助 我 们 进行 调试 。 这 些 宏 在 扩展 后 会 提供 当前 编译 操作 的 相 
关 信息 ， 如 表 10-1 所 示 。 


表 10-1 
宏 说 明 


代表 当前 行 号 的 十 进 制 常数 

一 上 TI 一 代表 当前 文件 名 的 字符 串 

mm dd yyyy 格 式 的 字符 串 ， 代 表 当前 日 期 

hzmm:ss 格 式 的 字符 串 ， 代 表 当 前 时 间 
注意 ， 这 些 符号 的 前 后 各 有 两 个 下 划 线 ， 这 是 标准 的 预 处 理 器 符号 通常 的 做 法 ， 你 应 该 注意 避免 

选择 可 能 会 与 它们 冲突 的 符号 。 上 面 说 明 中 的 术语 当前 指 的 是 预 处 理 操作 正在 执行 的 屠 -时 刻 ， 即 正 

在 运行 编译 器 对 文件 进行 处 理 时 的 时 间 和 日 期 . 


调试 信息 
请 看 下 面 这 个 程序 cinfo.c， 如 果 在 编译 它 时 启用 了 调试 ， 就 会 打印 出 编译 时 的 日 期 和 时 间 ， 


include <stdio.h> 
#include «stdlib.n» 





















int main() 
t 


#ifdef DEBUG 
Printf(*'Compiled: * _DATE_ * at - —TIME | "\n"); 


printf(*This is line $d of file s\n —LINE , | FILE ); 
fendif 

printf("hello worldin*); 

exit(0); 
) 


编译 这 个 程序 时 启用 调试 (用 -ppsauc)， 我 们 将 看 到 如 下 所 示 的 编译 信息 : 
5 ce -o cinfo -DDEBUG cinfo.c 

$ ./cinfo 

Compiled: Jun 30 2007 at 22:58:43 

This is line 8 of file cinfo.c 

hello world 


EXTIJ 

作为 编译 器 的 一 部 分 的 C 语 言 预 处理 器 趴 踪 记 录 正在 编译 的 当前 文件 和 文件 中 的 当前 行 。 当 它 在 
代码 中 遇 到 符号 _LTNE_ 和 _ FILE 时， 就 将 它们 替换 为 这 些 变量 的 当前 什 (编译 时 刻 )， 对 编译 日 
期 和 时 间 的 处 理 也 与 此 相同 。 因为 “prE_ 和 __TTME 都 是 字符 串 ， 所 以 我 们 可 以 用 print 函数 的 
格式 字符 串 把 它们 连 在 一 起 ， ANSIC 标 准 定义 相 邻 的 字符 串 可 以 被 看 作为 一 个 字符 串 ， 
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无 需 重新 编译 的 调试 技巧 

在 继续 学 习 新 的 内 容 之 前 ,我 们 先 介绍 一 个 使 用 printf 函 数 帮助 调试 的 技巧 , 它 的 好 处 是 无 需 使 
用 #ifdef DEBUG 语 句 ， 后 者 还 需要 重新 编译 才能 开始 对 程序 进行 调试 。 

方法 是 在 程序 中 增加 一 个 作为 调试 标志 的 全 局 变量 , 这 使 得 用 户 可 以 在 命令 行 上 通过 -a 选 项 切换 
是 否 启用 调试 模式 ， 即 使 程序 已 经 发 布 了 ， 仍 然 可 以 这 样 做 ， 该 方法 同时 还 会 在 程序 中 增加 一 个 用 于 
记录 调试 信息 的 函数 。 现 在 我 们 可 以 把 如 下 的 内 容 加 入 到 程序 代码 中 : 

if (debug) ( 

sprintf (msg, ...) 
write_debug (msg) 

) 

你 应 该 将 调试 信息 输出 到 标准 错误 输出 scaerr， 或者， 如 果 因为 程序 的 原因 不 能 这 样 做 ， 你 还 可 
以 使 用 syslog 函 数 提供 的 日 志 功 能 。 

如 果 用 这 种 调试 方法 来 解决 程序 开发 过 程 中 的 问题 ， 你 可 以 将 这 些 代码 一 直 留 在 程序 中 。 只 要 你 
比较 谨慎 在 意 ， 这 样 做 将 是 相当 安全 的 。 它 的 好 处 体现 在 ， 当 程序 发 布 之 后 ， 如 果 用 户 过 到 了 问题 ， 
他 们 自己 就 可 以 在 运行 程序 时 打开 调试 功能 ， 自 己 完成 诊断 错误 的 工作 。 在 出 现 问题 时 除了 报告 段 错 
误 外 ， 它 们 还 可 以 报告 出 当时 程序 正在 做 什么 ， 而 不 仅 是 用 户 本 人 正在 做 什么 。 这 两 者 之 间 的 区 别 还 
是 很 明显 的 。 

当然 ， 这 样 做 也 有 一 个 明显 的 不 足 ， 就 是 程序 的 长 度 会 有 所 增加 。 但 在 大 多 数 情况 下 ， 它 只 是 一 
个 表面 问题 ， 算 不 上 是 实际 意义 上 的 问题 。 程 序 的 长 度 可 能 会 增加 20% 或 30%， 但 往往 并 不 会 对 程序 
的 性 能 造成 真正 的 影响 。 只 有 在 程序 的 长 度 提高 几 个 数量 级 时 ， 才 会 造成 程序 性 能 的 降低 。 


10.24 ”程序 的 受 控 执行 


现在 回 到 示例 程序 ， 该 程序 有 一 个 漏洞 ， 我 们 可 以 修改 程序 ， 增 加 一 些 代码 把 变量 在 程序 运行 时 
的 值 打印 出 来 ， 或 者 还 可 以 用 调试 器 来 控制 程序 的 执行 ， 随 时 查看 这 些 变量 的 状态 。 

商业 UNIX 系 统 中 有 许多 可 用 的 调试 器 , 能 用 哪些 调试 器 取决 于 厂商 。 常见 的 有 adb、sdb、idebug 
和 dbx。 较 复杂 的 调试 器 可 以 在 源 代码 级 别 查看 程序 的 比较 详细 的 状态 信息 。GNU 的 调试 器 gdb 可 
以 在 Linux 和 许多 类 UNIX 系 统 中 使 用 ) 就 可 以 做 到 这 一 点 。 目 前 有 一 些 针 对 gab 的 “前 端 ”程序 ， 它 
们 提供 非常 友好 的 用 户 界面 ，xxgdb、Kkpbg 和 aaa 都 是 这 样 的 程序 。 一 些 IDE， 比 如 我 们 在 第 9 章 介绍 
的 ， 也 提供 了 调试 功能 或 一 个 用 于 gab 的 前 端 。Emacs 编 辑 器 甚至 还 提供 了 一 个 功能 Caab-mode), ft 
许 用户 在 程序 上 运行 gab， 设 置 断 点 并 查看 现在 执行 到 源 代码 中 的 哪 一 行 。 

为 了 能 够 调试 程序 ， 我 们 需要 编译 它 时 加 上 -一 个 或 多 个 特殊 的 编译 器 选项 。 这 些 选项 的 作用 是 
让 编译 器 在 程序 中 添加 额外 的 调试 信 4 包括 各 种 符号 和 源 代码 行 号 ， 调 试 器 将 利用 这 些 信 
息 向 用 户 显 示 程 序 已 经 执行 到 源 代码 的 位 置 。 

-9 标志 是 对 程序 进行 调试 性 编译 时 常用 的 一 个 选项 。 我 们 必须 在 编译 每 个 需要 调试 的 源 文件 时 都 
加 上 这 个 选项 ， 对 链接 器 也 要 这 样 做 (编译 器 会 把 这 个 标志 自动 传递 给 链接 器 )， 它 将 使 用 特殊 版 本 
的 C 语 言 标准 库 以 提供 库 函 数 中 的 调试 支持 。 对 那些 在 编译 时 没有 加 上 调试 功能 的 函数 库 ， 虽 然 调试 
工作 也 能 够 进行 ， 但 灵活 性 就 要 差 些 。 

调试 信息 的 加 入 将 使 可 执行 程序 的 长 度 成 倍增 加 最 高 可 达到 10 倍 )。 尽 管 可 执行 程序 的 容量 可 
能 增加 了 并 且 占用 了 更 多 的 磁盘 空间 )， 但 程序 运行 时 所 需要 的 内 存 数量 还 是 和 原来 一 样 。 程 序 调 
试 结束 后 ， 最 好 还 是 将 调试 信息 从 程序 的 发 行 版 本 中 删除 。 
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你 可 以 用 命令 strip <file> 将 可 执行 文件 中 的 调试 信息 删除 而 不 需要 重新 编译 程序 . 


10.3 ”使 用 gab 进行 调试 


我 们 将 使 用 GNU 的 调试 器 gdb 调试 这 个 程序 。gdb 是 一 个 功能 很 强大 的 调试 器 ， 它 是 一 个 自由 软 
件 ， 能 够 用 在 许多 UNIX 平 台 上 。 它 同时 也 是 Linux 系 统 中 的 默认 调试 器 。gab 已 被 移植 到 许多 其 他 的 
计算 机 平台 上 ， 并 且 能 够 用 于 调试 局 入 式 实时 系统 。 


10.3.1 启动 gab 


现在 ， 对 我 们 的 示例 程序 进行 调试 性 编译 并 启动 gab， 如 下 所 示 : 

$ cc -g -o debug3 debug3.c 

$ gdb debug3 

GNU gdb 6.6 

Copyright (C) 2006 Free Software Foundation, Inc. 

GDB is free software, covered by the GNU General Public License, and you are 
welcome to change it and/or distribute copies of it under certain conditions. 
Type "show copying" to see the conditions. 

There is absolutely no warranty for GDB. Type 'show warranty" for details. 
This GDB was configured as "i586-suse-linux"... 

Using host libthread db library "/lib/libthread db.so.l'. 

(gdb) 


gab 有 详细 的 在 线 帮助 ， 它 的 完整 使 用 手册 由 一 组 文件 构成 ， 可 以 通过 info 程 序 或 Emacs 程序 查 
阅 。 如 下 所 示 : 

(gdb) help 

List of classes of commands: 


aliases -- Aliases of other commands 

breakpoints -- Making program stop at certain points 
data -- Examining data 

files -- Specifying and examining files 

internals -- Maintenance commands 

obscure -- Obscure features 

running -- Running the program 

stack -- Examining the stack 

status -- Status inquiries 

support -- Support facilities 

tracepoints -- Tracing of program execution without stopping the program 
user-defined -- User-defined commands 


Type "help" followed by a class name for a list of commands in that class. 
Type "help all* for the list of all commands. 

Type "help* followed by command name for full documentation. 

Type "apropos word" to search for commands related to "word". 

Command name abbreviations are allowed if unambiguous. 

(gdb) 


gab 本 身 是 一 个 基于 文本 的 应 用 程序 ， 但 它 为 一 些 重复 性 的 任务 准备 了 一 些 快 捷 键 。gab 的 许多 版 
本 都 具备 带 历史 记录 的 命令 行 编辑 功能 ， 用 户 可 以 尝试 用 方向 键 ) 回 卷 并 再 次 执行 以 前 输入 过 的 命 
令 。 它 的 所 有 版 本 都 支持 “ 空 命令 "， 即 直接 按 下 回 车 键 再 次 执行 最 近 执 行 过 的 那 条 命令 。 在 用 step 
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或 next 命 令 单 步 执 行程 序 时 ， 这 个 “ 空 命令 ”非常 有 用 。 
要 退出 gab， 使 用 guit 命 令 即 可 。 


10.32 ”运行 一 个 程序 


我 们 可 以 用 run 命 令 来 执行 这 个 程序 .在 run 命 令 中 给 出 的 所 有 参数 都 将 作为 程序 的 参数 传递 给 程 
序 。 在 本 例 中 ， 我 们 的 程序 无 需 任何 参数 。 

在 这 里 ， 我 们 假设 你 的 系统 和 本 书 两 位 作者 的 一 样 ， 都 产生 了 段 错误 。 如 果 情况 并 非 如 此 ， 请 继 
续 往 下 看 。 如 果 在 编写 自己 的 程序 时 遇 到 了 段 错误 ， 在 学 完 本 章 后 就 应 该 知道 如 何 解决 它 了 。 如 果 没 
有 过 到 过 段 错误 ， 但 还 想 在 阅读 本 书 时 继续 使 用 这 个 示例 程序 ， 你 可 以 直接 跳 到 debug4.c 程 序 ， 到 那 
时 我 们 已 把 这 个 程序 的 第 一 个 内 存 访问 错误 修复 好 了 。 

(gdb) run 

Starting program: /home/neil/BLP4e/chapteril0/debug3 


Program received signal SIGSEGV, Segmentation fault. 

Ox0804846f in sort (a-0x804a040, n=5) at debug3.c:23 

23 m 23 * if(al3].key > alj«1].key) ( 

(gdb) 

与 前 面 一 样 ， 这 个 程序 运行 不 正确 。 程 序 运行 失败 时 ，gab 会 报告 出 失败 的 原因 及 位 置 。 现 在 我 
们 即 可 根据 这 些 调查 这 个 问题 的 根本 原因 。 

根据 你 的 操作 系统 内 核 、C 函 数 库 和 编译 器 版 本 的 具体 情况 ， 你 可 能 会 看 到 程序 的 错误 发 生 在 一 
个 稍微 不 同 的 地 点 ,比如 发 生 在 交换 数组 元 素 的 第 25 行 而 不 是 发 生 在 比较 数组 元 素 成 员 key 的 第 23 行 。 
如 果 你 是 属于 这 种 情况 ， 则 应 该 看 到 如 下 所 示 的 输出 结果 : 

Program received signal SIGSEGV, Segmentation fault. 

0x8000613 in sort (a-0x8001764, n=5) at debug3.c:25 








25 /* 325 sy alj] = afj+l]; 
不 管 你 是 否 属于 这 种 情况 ， 你 都 可 以 沿 着 我 们 的 gab 样 本 示例 继续 学 习 。 
10.8.3 HURER 


程序 停止 在 源 文件 aebug3 .c 的 第 23 行 ， 该 行 位 于 sort 函 数 中 。 如 果 我 们 在 编译 程序 时 没有 添加 
调试 信息 (cc -g)， 就 无 法 看 到 程序 失败 时 所 停 的 位 置 ， 也 无 法 用 变量 名 来 检查 数据 。 

我 们 可 以 用 backtrace 命 令 来 查 出 程序 是 如 何 到 达 这 一 位 置 的 ， 如 下 所 示 ; 

(gdb) backtrace 

#0 0x0804846f in sort (a-0x804a040, n-5) at debug3.c:23 

#1 0x08048583 in main () at debug3.c:37 

(db) 

这 是 一 个 非常 简单 的 程序 ， 因 为 我 们 并 未 在 其 他 的 函数 中 调用 很 多 函数 ， 所 以 跟踪 信息 也 很 少 。 
你 可 以 看 到 ，sort 函 数 是 由 同一 个 文件 中 的 main 函 数 在 第 37 行 调用 的 。 通常 在 实际 工作 中 过 到 的 问题 
要 复杂 得 多 ，backtrace 命 令 将 帮助 我 们 找到 程序 到 达 错误 地 点 的 路 径 。 当 调试 的 函数 可 能 会 从 许多 
不 同 的 地 方 被 调用 时 ， 这 个 命令 将 非常 有 用 。 

backtrace 命 令 可 以 简写 为 bt， 为 了 与 其 他 调试 器 兼容 ,gdb 还 有 一 个 命令 where 用 来 完成 相同 的 
功能 。 
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10.3.4. ”检查 变量 


gab 在 停止 程序 时 给 出 的 信息 以 及 从 跟踪 栈 得 到 的 信息 可 以 让 我 们 看 到 函数 参数 的 取 值 。 

sort 函 数 被 调用 时 有 一 个 参数 a， 它 的 取 值 是 0x804a040。 这 是 数组 的 地 址 ， 在 不 同 的 系统 中 这 
个 值 通 常 是 不 一 样 的 ， 这 要 视 用 户 使 用 的 编译 器 和 操作 系统 而 定 。 

错误 出 现在 第 23 行 ， 该 行 对 数组 的 两 个 元 素 进行 比较 ， 如 下 所 示 : 

m 23 *j it(a[j] .key > alj*1].key) { 

我 们 可 以 用 调试 器 检查 函数 参数 、 局 部 变量 和 全 局 数据 的 内 容 。print 命 令 的 作用 就 是 给 出 变量 
和 其 他 表达 式 的 内 容 ， 如 下 所 示 : 


(gdb) print j 
$1=4 


我 们 看 到 局 部 变量 j 的 值 是 4。gab 会 用 伪 变 量 来 保存 类 似 这 样 的 输出 值 以 备 后 用 。 这 里 就 将 值 4 
赋 给 了 伪 变 量 $1， 后 续 的 命令 将 把 它们 的 输出 结果 依次 保存 到 $2、s$3 等 中 去 。 

局 部 变量 j 的 值 是 4 意味 着 程序 尝试 执行 的 是 这 样 一 条 命令 : 

if(a[4).key > a[4+1].key) 

我 们 传递 给 sort 函 数 的 数组 array 只 有 5 个 元 素 ,它们 的 下 标 从 0 一 4。 因 此 ， 这 条 语句 读 的 是 一 个 
不 存在 的 数组 元 素 array [5] 。 循 环 计数 器 变量 j 取 了 一 个 错误 的 值 。 

如 果 执行 这 个 示例 程序 时 , 程序 停 在 了 第 25 行 ,就 说 明 系 统 是 在 准备 交换 数组 元 素 时 才 检 测 到 读 
数组 越界 错误 的 ， 第 25 行 执行 的 语句 是 : 

nd */ alj] = alj+1]; 

当 j 取 值 为 4 时 ， 真 正 执行 的 是 这 样 一 条 语句 : 

a[4] = a[4«1]; 

我 们 可 以 用 print 命 令 的 表达 式 来 查看 处 理 过 的 数组 元 素 。gab 人 允许 我 们 使 用 几乎 所 有 合法 的 C 语 
言 表达 式 来 打印 变量 、 数 组 元 素 和 指针 的 取 值 。 

(gdb) print a[3] 


$2 = (data = "alex", '\0' «repeats 4091 times», key = 1) 

(gdb) 

gdb 将 命令 的 结果 保存 在 伪 变量 s<number> 中 。 最 后 一 次 操作 的 结果 总 是 为 $S， 倒 数 第 二 次 操作 的 
结果 为 $$。 这 使 得 我 们 可 以 把 某 次 操作 的 结果 用 在 另 一 个 命令 中 。 例 如 : 

(gdb) print j 

$3 = 4 

(gdb) print a[$-1].key 

$421 


10.8.5 列 出 程序 源 代码 

我 们 可 以 直接 在 gab 里 用 1 ist 命 令 列 出 程序 的 源 代 码 。 这 个 命令 会 打印 出 围绕 当前 位 置 前 后 的 一 
段 代码 ， 如 果 继续 使 用 1 ist 命令， 将 显示 更 多 的 代码 。 你 也 可 以 给 1ist 命 令 提供 一 个 行 号 或 函数 名 作 
为 参数 ， 它 将 显示 指定 位 置 前 后 的 代码 。 


(gdb) list 
18 7 a8 *J int s = 1; 
19 f* 19 * 


20 /* 20 +y for(; i < n & s !- 0; i++) ( 
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21 /[* Mos s-0; 

22 /* 22 */ for(j = 0; j < n; j++) { 

23 /* 23 *j if(alj].key > a[j«1].key) ( 
24 /* 24 */ item t = alj]; 

25 i" am «y alj] = ali*1]; 

26 4+ 26 + alj+1] = t; 

27 Many s+; 

(gdb) 


我 们 可 以 看 到 在 第 22 行 ， 循 环 被 设置 为 在 变量 j 小 于 n 时 继续 执行 。 而 在 本 例 中 ，n 等 于 5， 所 以 变 
量 j 的 最 大 取 值 为 4。 当 j 取 值 为 4 时 ， 参 加 比较 的 数组 元 素 分 别 为 a[4] 和 a[5]。 对 这 一 特定 问题 的 一 
种 解决 方法 是 ， 将 终止 循环 的 条 件 改正 为 j < n-1。 

我 们 对 程序 做 出 修改 ， 将 新 的 程序 命名 为 aebug4.c， 重 新 编译 并 运行 它 : 


ye 32 */ for(j = 0; j < n-1; j++) ( 
$ cc -g -o debug4 debug4.c 

$ ./debugá 

array[0] = (john, 2) 

array|l] = (alex, 1) 

array|2] = (bill, 3) 

array[3] = (neil, 4) 

arrayl4] = (rick, 5) 


程序 的 运行 仍然 不 正常 ， 因 为 它 输 出 的 是 错误 的 排序 列表 。 下 面 我 们 用 gab 对 程序 的 运行 做 单 步 
10.3.6 ”设置 断 点 


为 了 找 出 程序 失败 的 位 置 ， 我 们 需要 能 够 查看 程序 在 运行 时 所 做 的 事情 。 我 们 可 以 通过 设置 断 点 
在 任 一 位 置 停止 程序 的 运行 。 这 将 中 断 程序 的 运行 并 将 控制 权 返 回 给 调试 器 。 然 后 我 们 即 可 对 变量 进 
行 检查 并 让 程序 从 断 点 位 置 继续 执行 。 

在 sort 函 数 中 有 两 个 循环 。 外 层 循环 针对 每 个 数组 元 素 执行 一 次 ， 它 的 循环 计数 变量 是 i。 内 层 
循环 的 作用 是 交换 相 邻 的 两 个 元 素 。 总 的 效果 是 让 比较 小 的 元 素 像 “气泡 ” 一样“ 冒 ”到 数组 的 顶部 。 
外 层 循环 每 执行 一 次 ， 数 组 中 最 大 的 元 素 就 会 “下 沉 ” 到 数组 的 底部 。 我 们 可 以 通过 在 外 层 循环 中 停 
止 程序 的 运行 并 检查 数组 的 状态 来 核实 这 一 点 。 

有 许多 命令 可 以 用 来 设置 断 点 。 用 gdb 的 help breakpoint 命 令 可 以 列 出 这 些 命令 ， 如 下 所 示 : 


(gdb) help breakpoint 
Making program stop at certain points. 








List of commands: 





awatch -- Set a watchpoint for an expression 

break -- Set breakpoint at specified line or function 

catch -- Set catchpoints to catch events 

clear -- Clear breakpoint at specified line or function 

commands -- Set commands to be executed when a breakpoint is hit 
condition -- Specify breakpoint number N to break only if COND is true 
delete -- Delete some breakpoints or auto-display expressions 

delete breakpoints -- Delete some breakpoints or auto-display expressions 
delete checkpoint -- Delete a fork/checkpoint (experimental) 


delete mem -- Delete memory region 
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delete tracepoints -- Delete specified tracepoints 
disable -- Disable some breakpoints 

disable breakpoints -- Disable some breakpoints 

disable display -- Disable some expressions to be displayed when program stops 
disable mem -- Disable memory region 

disable tracepoints -- Disable specified tracepoints 

enable -- Enable some breakpoints 

enable delete -- Enable breakpoints and delete when hit 

enable display -- Enable some expressions to be displayed when program stops 
enable mem -- Enable memory region 

enable once -- Enable breakpoints for one hit 

enable tracepoints -- Enable specified tracepoints 





hbreak -- Set a hardware assisted breakpoint 

ignore -- Set ignore-count of breakpoint number N to COUNT 
rbreak -- Set a breakpoint for all functions matching REGEXP 
rwatch -- Set a read watchpoint for an expression 

tbreak -- Set a temporary breakpoint 

tcatch -- Set temporary catchpoints to catch events 

thbreak -- Set a temporary hardware assisted breakpoint 
watch -- Set a watchpoint for an expression 


Type "help" followed by command name for full documentation. 
Type "apropos word" to search for commands related to "word*. 
Command name abbreviations are allowed if unambiguous. 

在 第 21 行 设置 一 个 断 点 ， 然 后 运行 这 个 程序 ， 如 下 所 示 : 

$ gdb debug4 

(gdb) break 21 

Breakpoint 1 at 0x8048427: file debug4.c, line 21. 


(gdb) run 
Starting program: /home/neil/BLP4e/chapterl0/debug4 


Breakpoint 1, sort (a-0x804a040, n=5) at debugá.c:21 

21 /[* 21 o8 s-0 

我 们 可 以 打印 出 数组 元 素 的 值 ， 然 后 用 cont 命 令 继续 执行 程序 。 程序 会 一 直 运 行 直到 它 过 到 下 一 
个 断 点 ， 在 本 例 中 就 是 它 再 次 执行 到 第 21 行 的 时 候 。 在 同一 时 间 程序 中 可 以 存在 许多 个 断 点 。 

(gdb) print array[0] 

$1 = (data = "bill", 'X0' «repeats 4091 times», key = 3) 

要 想 打印 出 一 组 连续 的 数据 项 ， 我 们 可 以 使 用 e<number> 让 sab 打 印 出 指定 数目 的 数组 元 素 。 如 
果 要 把 数组 中 的 所 有 元 素 都 打印 出 来 ， 使 用 的 命令 如 下 所 可 


(gdb) print array[0]@5 
$2 = ((data = "bill", '\0' «repeats 4091 times», key = 3), ( 











data = *neil*, '\0' «repeats 4091 times», key = 4), ( 
data = "john", 'X0' «repeats 4091 times», key = 2), ( 
data = "rick", 'X0' «repeats 4091 times», key = 5), ( 


data = *alex", '\0' «repeats 4091 times», key = 1)) 
注意 : 我 们 对 输出 结果 做 了 些 整理 ， 让 它们 更 容易 阅读 。 因 为 这 是 第 一 次 进入 循环 ， 所 以 数组 未 
发 生变 化 。 继 续 执行 程序 ， 随 着 程序 的 进展 ， 我 们 将 看 到 数组 array 的 后 续 变化 : 


(gdb) cont 
Continuing. 
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Breakpoint 1, sort (a=0x8049580, n=4) at debug4.c:21 
21 m di aj s-0; 


(gdb) print array[0]e5 
$3 = ((data = "bill", '\0' «repeats 4091 times», key = 3), ( 





data 'N0' «repeats 4091 times», key = 2), ( 
data '\0' «repeats 4091 times», key = 4), ( 
data 'N0' «repeats 4091 times», key = 1), ( 


data = "rick", '\0' «repeats 4091 times», key = 5)) 


(gdb) 
我 们 可 以 用 aisplay 命 令 告诉 gab， 在 每 次 程序 停 在 断 点 位 置 时 自动 显示 数组 的 内 容 ， 如 下 所 示 ; 
(gdb) display array[0]e5 

1: arrayl0] 6 5 = ((data = "bill", '\0' «repeats 4091 times», key = 3), ( 

'\0' «repeats 4091 times», key = 2), ( 

'N0' «repeats 4091 times», ke: 
"alex", '\0' «repeats 4091 times», Xe: 
data = "rick", '\0' «repeats 4091 times», key 


此 外 ， 我 们 可 以 修改 断 点 设置 ， 使 程序 不 是 在 断 点 处 停 下 来 ， 而 只 是 显示 要 查看 的 数据 ， 然 后 继 
续 执行 。 我 们 用 commands 命 令 来 完成 这 一 工作 。 它 的 作用 是 指定 在 程序 到 达 断 点 位 置 时 需要 执行 的 调 
试 器 命令 。 因 为 我 们 已 设置 了 display 命令 ， 所 以 只 需 设置 断 点 命令 为 继续 执行 即 可 。 如 下 所 示 ， 


(gdb) commands 

Type commands for when breakpoint 1 is hit, one per line. 
End with a line saying just "end". 

> cont 

> end 


现在 ， 当 程序 继续 执行 时 ， 它 将 一 直 执行 到 结束 ， 外 层 循环 每 次 执行 都 会 打印 出 数组 的 内 容 ， 如 
下 所 示 : 

(gdb) cont 

Continuing. 





Breakpoint 1, sort (a-0x8049684, n-3) at debug4.c:21 
21 /* 2 7 s 
1: array[0] @ 5 = ((data = "john", 





0; 
'N000' «repeats 4091 times», key - 2), ( 





data = "bill", 'X000' «repeats 4091 times», key = 3), ( 
data = "alex", '\000' «repeats 4091 times», key = 1), ( 
data = "neil", 'X000' «repeats 4091 times», key = 4), ( 
data = "rick", 'X000' «repeats 4091 times», key = 5)) 

array[0] = (john, 2) 

array[1] = (alex, 1) 

array[2] = (bill, 3) 

array[3] = (neil, 4) 

array[4] = (rick, 5) 


Program exited with code 025. 
(gdb) 


gdb 报 告 这 个 程序 在 退出 时 带 有 一 个 不 常见 的 退出 码 ， 这 是 因为 程序 本 身 未 调用 exit 函 数 ， 并 且 
也 没有 从 main 函 数 返 回 一 个 值 。 本 例 中 的 退出 码 没 有 实际 意义 ， 只 有 exit 函 数 才 会 提供 有 意义 的 退 
出 码 。 
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看 上 去 程序 执行 外 部 循环 的 次 数 少 于 预期 值 。 我 们 可 以 看 到 ， 循 环 终止 条 件 中 使 用 的 参数 n 的 值 
在 每 次 到 达 断 点 时 都 在 减少 。 这 意味 着 循环 不 会 执行 足够 的 次 数 。 问 题 出 在 程序 的 第 30 行 ， 该 行 对 变 
量 n 做 了 减法 操作 ， 如 下 所 示 : 

18:89 y n--; 

上 面 这 行 语句 是 出 于 优化 程序 的 考虑 ， 每 次 外 部 循环 结束 时 ， 数 组 array 中 最 大 的 元 素 将 被 放 到 
数组 的 最 底部 ， 所 以 下 一 次 执行 外 部 循环 时 就 没有 必要 考虑 数组 的 最 后 一 个 元 素 了 。 但 是 ， 正 如 我 们 
所 看 到 的 ， 这 个 优化 措施 影响 了 外 部 循环 并 引发 了 问题 。 针 对 这 一 问题 的 最 简单 的 解决 方法 当然 还 
有 其 他 方法 ) 就 是 删除 引起 问题 的 一 行 。 下 面 我 们 就 通过 用 调试 器 打上 补丁 的 方法 来 解决 ， 看 看 是 否 
能 成 功 。 

10.3.7 用 调试 器 打 补 丁 

我 们 已 经 看 到 ， 我 们 可 以 通过 调试 器 设置 断 点 和 查看 变量 的 取 值 。 通 过 将 断 点 的 设置 与 相应 的 操 
作 结 合 起 来 ， 就 可 以 尝试 修改 程序 〈 也 被 称 为 打 补 丁 ) 而 不 需要 改变 程序 的 源 代码 并 重新 编译 。 在 本 
例 中 ， 我 们 需要 在 程序 的 第 30 行 中 断 程序 ， 增 加 变量 n 的 值 ， 这 样 ， 程 序 执行 到 第 30 行 时 ，n 的 值 并 未 
发 生变 化 。 

重新 开始 执行 这 个 程序 。 首先 , 必须 删除 刚才 设置 的 断 点 和 display 命令 的 内 容 。 我 们 可 以 用 info 
命令 查看 曾经 设置 过 的 断 点 及 display 命令 的 内 容 ， 如 下 所 示 : 

(gdb) info display 

Auto-display expressions now in effect: 

Num Enb Expression 

1: y array[0] @ 5 

(gdb) info break 


Num Type Disp Enb Address what 

1 breakpoint keep y — 0x08048427 in sort at debug4.c:21 
breakpoint already hit 3 times 
cont 


我 们 可 以 禁用 这 些 设置 ， 也 可 以 将 其 全 部 删除 。 如 果 禁 用 它们 ， 我 们 就 可 以 在 今后 必要 的 时 候 重 
新 启用 这 些 保留 的 设置 ， 如 下 所 示 : 

(gdb) disable break 1 

(gdb) disable display 1 

(gdb) break 30 

Breakpoint 2 at 0x8048545: file debug4.c, line 30. 

(gdb) commands 2 

Type commands for when breakpoint 2 is hit, one per line. 

End with a line saying just "end". 

»set variable n = n+1 

»cont 

>end 

(gdb) run 

Starting program: /home/neil/BLP4e/chapter10/debug4 





Breakpoint 2, sort (a-0x804a040, n-5) at debug4.c:30 
30 $* dé y Sp 





Breakpoint 2, sort (a=0x804a040, n=5) at debug4.c:30 
30 /* 30 */ n--; 
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Breakpoint 2, sort (a-0x804a040, n-5) at debug4.c:30 
30 a x, n--; 





Breakpoint 2, 5) at debug4.c:30 
30 J* ; 


sort (a=0x804a040, 
30 */ 


n 








Breakpoint 2, sort (a=0x804a040, 





5) at debug4.c:30 


30 1* 30 */ n 
array[0] - (alex, 1) 
array[1] - (john, 2) 
array(2] = (bill, 3) 
array[3] = (neil, 4) 
array[4] = (rick, 5) 


Program exited with code 025. 
(gdb) 


程序 一 直 运行 到 结束 并 给 出 了 正确 的 结果 。 我 们 现在 即 可 对 源 代码 进行 修改 并 用 更 多 的 数据 对 它 
进行 测试 了 。 
10.3.8 深入 学 习 gab 


GNU 调 试 器 是 一 个 功能 非常 强大 的 工具 , 它 可 以 为 我 们 提供 许多 与 执行 中 的 程序 的 内 部 状态 有 关 
的 信息 。 在 支持 硬件 断 点 功能 的 系统 上 ， 可 以 用 gab 实 时 监控 变量 取 值 的 变化 情况 。 硬 件 断 点 是 某 些 
CPU 提供 的 功能 ， 这 些 处 理 器 可 以 在 触发 某 个 特定 条 件 〈 一 般 为 对 某 个 给 定 区 域 的 内 存 访问 操作 ) 时 
自动 停止 运行 。 此 外 ，gab 还 可 以 监控 表达 式 ， 即 当 某 个 表达 式 取 了 一 个 特定 值 时 ，gab 可 以 暂停 稳 序 
的 运行 ， 而 不 管 表达 式 的 计算 发 生 在 程序 中 的 位 置 ， 但 这 样 做 会 对 系统 的 性 能 有 所 影响 。 

断 点 可 以 和 计数 、 条 件 结合 在 一 起 设置 , 只 有 在 经 过 了 指定 的 次 数 或 满足 某 个 条 件 时 才 触 发 断 点 。 

gdb 还 可 以 将 其 自身 附 在 已 经 运行 的 程序 上 。 这 对 调试 客户 /服务 器 系统 很 有 帮助 ， 因 为 你 可 以 
在 异常 服务 器 正在 运行 时 对 其 进行 调试 ， 而 不 必 先 停止 它 ， 然 后 再 重启 它 。 你 可 以 在 编译 程序 时 用 
如 gcc -0 -9 这 样 的 命令 来 同时 获得 程序 优化 和 调试 信息 的 好 处 。 但 这 样 做 的 缺点 是 ， 优 化 可 能 会 对 
程序 代码 的 先后 顺序 进行 调整 ， 因 此 ， 在 对 代码 进行 单 步调 试 时 ， 你 可 能 会 发 现 你 要 在 代码 中 跳 来 跳 
去 以 达到 与 原来 的 源 代码 同样 的 效果 。 

我 们 还 可 以 用 gab 来 调试 已 经 崩溃 的 程序 。 程 序 运行 失败 时 ，Linux 和 UNIX 系 统 通常 会 产生 一 个 
核心 转 储 〈core dump)， 并 将 它 保存 在 core 文 件 中 。 这 个 文件 其 实 是 程序 的 内 存 映像 文件 ， 它 包含 程 
序 在 运行 失败 的 那个 时 刻 的 全 局 变量 的 取 值 。 你 可 以 用 gab 找 出 程序 发 生 崩 溃 的 位 置 。 详 细 的 资料 请 
查阅 gab 的 手册 页 。 

gab 遵 守 GPL 的 条 款 ， 大 多 数 UNIX 系 统 都 支持 它 。 我 们 强烈 建议 读者 掌握 这 一 工具 。 


10.4 ”其 他 调试 工具 


除了 像 gab 这 样 彻底 的 调试 器 外 ，Linux 系 统一 般 还 会 提供 许多 能 够 帮助 你 完成 调试 工作 的 其 他 工 
有 具 。 其 中 有 的 是 提供 关于 程序 的 静态 信息 ， 另 外 一 些 则 是 提供 动态 分 析 。 

静态 分 析 只 能 通过 程序 的 源 代 码 提供 信息 。ctags、cxref 和 cflow 等 就 是 一 些 静态 分 析 程序 ， 它 
们 可 以 通过 源 文件 提供 有 关 函 数 调用 和 函数 所 在 位 置 的 有 用 信息 。 

动态 分 析 提 供 的 是 与 程序 执行 过 程 中 的 行为 有 关 的 信息 .prof 和 gprof 等 就 是 一 些 动态 分 析 程序 ， 
它们 提供 的 信息 包括 已 经 执行 了 哪些 函数 以 及 这 些 函数 的 执行 时 间 。 
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下 面 我 们 将 介绍 其 中 一 些 工 具 及 其 输出 。 虽 然 这 些 工 具 中 的 大 部 分 都 有 可 以 免费 获得 的 版 本 ， 但 
并 非 在 所 有 的 系统 中 都 可 以 使 用 所 有 这 些 工具 。 


10.4.1 lint: 清理 程序 中 的 “垃圾 ” 


早期 的 UNIX 系 统 提供 了 工具 1int， 从 本 质 上 看 , 它 只 是 C 语 言 编译 器 的 一 个 前 端 , 但 增加 了 一 些 
常识 性 的 测试 并 可 以 产生 一 些 警告 信息 。 它 可 以 检测 出 未 经 赋值 的 变量 使 用 、 函 数 的 参数 未 使 用 等 情 
况 。 





编译 器 开发 的 , 它 已 不 能 很 
好 地 处 理 ANSIC 的 语法 了 。1linc 有 一 些 适用 于 UNIX 系 统 的 商业 版 本 ， 在 因特网 上 至 少 有 一 个 版 本 是 
针对 Linux 系 统 的 ， 它 的 名 字 是 splint， 过 去 常 把 它 称 为 Lclint， 它 是 MIT〔 麻 省 理工 学 院 ) 的 为 正 
式 规范 开发 工具 软件 这 一 项 目的 组 成 部 分 。 类 1int 工 具 splint 可 以 提供 有 用 的 代码 审查 注释 ， 该 软 
件 可 以 在 http://www.splint.org 上 找到 。 

下 面 这 个 程序 是 我 们 前 面 调试 过 的 示例 程序 的 早期 版 本 (Gebug0.c): 


Jnd. e) char *data; 
Mc o int key; 

]* 4 */ ) item; 

yep wy 

/* 6 */ item array[] = ( 
JE ids 二 "bill", 3), 
4*8. */ ("neil*, 4), 
4e 09 8 (*john*, 2), 
at 0 */ {"rick", 5), 
Vd ef {"alex", 1), 
1* 32 */ p 

TOES og 


/* 14 */ sortí(a,n) 
/* 15 */ item *a; 


837 2/ int i = 0, j = 0; 
DAE EE int s; 


A* 20 Ay for(;i«n&s != 0; ie) ( 

PECORE Cg s*0; 

£57 227 p for(j = 0; j < ni j++) { 
1*5933;5/ if(alj).key > alj*«1].key) ( 
/* 24 7; item t = a[3]; 
WES y alj] = alj+1]; 
A526 X) alj+1] = t; 

KNIE, ME Stt; 





Fads n--; 


Weide er 
/* 34 */ mein() 
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ar Neo ep ia i 
VETUS f sort (array,5); 
es ced 


这 个 版 本 在 第 20 行 有 一 个 问题 : 它 使 用 的 是 操作 符 s 而 不 是 zs&。 针 对 这 个 版 本 的 splint 示 例 输出 
经 过 编辑 后 显示 在 下 面 。 注 意 它 是 如 何 发 现 第 20 行 的 问题 的 一 一 程序 没有 初始 化 变量 s， 而 且 这 个 不 
正确 的 操作 符 可 能 会 给 条 件 测试 带 来 问题 。 


neilésusel03:-/BLP4e/chapterl0» splint -strict debug0.c 
Splint 3.1.1 --- 19 Mar 2005 





debug0.c:7:18: Read-only string literal storage used as initial value for 
unqualified storage: array[0].data = "bill" 
A read-only string literal is assigned to a non-observer reference. (Use 
-readonlytrans to inhibit warning) 
debug0.c:8:18: Read-only string literal storage used as initial value for 
unqualified storage: array[1].data = "neil" 
debug0.c:9:18: Read-only string literal storage used as initial value for 
unqualified storage: array[2].data = "john" 
debug0.c:10:18: Read-only string literal storage used as initial value for 
unqualified storage: array[3].data = "rick" 
debug0.c:11:18: Read-only string literal storage used as initial value for 
unqualified storage: array[4].data = "alex" 
debug0.c:14:22: Old style function declaration 
Function definition is in old style syntax. Standard prototype syntax is 
preferred. (Use -oldstyle to inhibit warning) 
debug0.c: (in function sort) 
debug0.c:20:31: Variable s used before definition 
An rvalue is used that may not be initialized to a value on some execution 
path. (Use -usedef to inhibit warning) 
debug0.c:20:23: Left operand of & is not unsigned value (boolean): 
i<ngs!=0 
An operand to a bitwise operator is not an unsigned values. This may have 
unexpected results depending on the signed representations. (Use 
-bitwisesigned to inhibit warning) 
debug0.c:20:23: Test expression for for not boolean, type unsigned int: 
i<négs!=0 
Test expression type is not boolean or int. (Use -predboolint to inhibit 





warning) 

debug0.c:25:41: Undocumented modification of a[]: a[j] = alj + 1] 
An externally-visible object is modified by a function with no /*@modifies@*/ 
Comment. The /*émodifies ... @*/ control comment can be used to give a 
modifies list for an unspecified function. (Use -modnomods to inhibit 
warning) 


debug0.c:26:41: Undocumented modification of a[]: a[j + 1] = t 
debug0.c:20:23: Operands of & are non-integer (boolean) (in post loop test): 
i«n&si!-0 
A primitive operation does not type check strictly. (Use -strictops to 
inhibit warning) 
debug0.c:32:14: Path with no return in function declared to return int 
There is a path through a function declared to return a value on which there 
is no return statement. This means the execution may fall through without 
returning a meaningful result to the caller. (Use -noret to inhibit warning) 
debug0.c:34:13: Function main declared without parameter list 
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A function declaration does not have a parameter list. (Use -noparams to 
inhibit warning) 
debugü.c: (in function main) 
debug0.c:36:22: Undocumented use of global array 
A checked global variable is used in the function, but not listed in its 
globals clause. By default, only globals specified in .lcl files are checked. 
To check all globals, use «aliglobals. To check globals selectively use 
/*écheckedé*/ in the global declaration. (Use -globs to inhibit warning) 
debug0.c:36:17: Undetected modification possible from call to unconstrained 
function sort: sort 
An unconstrained function is called in a function body where modifications 
are checked. Since the unconstrained function may modify anything, there may 
be undetected modifications in the checked function. (Use -modunconnomods to 
inhibit warning) 
debug0.c:36:17: Return value (type int) ignored: sort(array, 5) 
Result returned by function call is not used. If this is intended, can cast 
result to (void) to eliminate message. (Use -retvalint to inhibit warning) 
debug0. 4: Path with no return in function declared to return int 
debug. 8: Variable exported but not used outside debug0: array 
A declaration is exported, but not used outside this module. Declaration can 
use static qualifier. (Use -exportlocal to inhibit warning) 
debug0.c:14:13: Function exported but not used outside debug0: sort 
debug0.c:15:17: Definition of sort 
debug0.c:6:18: Variable array exported but not declared in header file 
A variable declaration is exported, but does not appear in a header file. 
(Used with exportheader.) (Use -exportheadervar to inhibit warning) 
debug0.c:14:13: Function sort exported but not declared in header file 
A declaration is exported, but does not appear in a header file. (Use 
-exportheader to inhibit warning) 
debug0.c:15:17: Definition of sort 


















Finished checking 
$ 


splint 工 具 抱怨 程序 中 有 老式 的 〈 非 ANSI 标 准 ) 函数 声明 ， 并 且 函 数 返回 类 型 4 
回 值 〈 或 没有 返回 值 》 不 一 致 。 这 些 虽 不 影响 程序 的 执行 ， 但 应 该 引起 注意 。 
它 还 发 现 了 两 个 真正 的 漏洞 ， 它 们 出 现在 下 面 这 段 代码 中 : 





22 code warnings 





它们 真正 的 返 


SN ong int s; 

419 039 oy 

a o ity for; i«n&s != 0; i++) { 
ZEE E s=0; 


splint 发 现 《 前 面 输出 中 的 阴影 部 分 ) 第 20 行 使 用 的 变量 s 未 经 初始 化 ， 并 且 在 该 行 应 该 使 用 更 
常见 的 操作 符 &g 而 不 是 现在 使 用 的 操作 符 &。 在 本 例 中 ，s 操 作 符 改变 了 测试 的 含义 ,确实 是 这 个 程序 
存在 的 一 个 问题 。 

这 些 错误 都 在 调试 开始 之 前 的 代码 审查 阶段 就 得 到 了 修复 。 虽 然 它们 是 我 们 为 了 演示 而 有 意 放 在 
那里 的 ， 但 在 真正 的 程序 中 ， 这 些 错误 可 以 说 是 屡见不鲜 。 


10.4.2 ”函数 调用 工具 


ctags、cxref 和 cflow 这 3 个 工具 构成 了 X/Open 规 范 的 一 部 分 内 容 ， 因 此 ， 具 备 软件 开发 能 力 的 
UNIX 系 统 都 会 有 这 3 个 工具 。 
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这 些 工具 以 及 本 章 介 绍 的 其 他 一 些 工具 可 能 没有 被 包括 在 你 的 Linux 发 行 版 中 。 如 果 是 
这 样 ， 你 就 需要 在 因特网 上 搜索 它们 。 比较 好 的 搜索 网 站 (对 支持 RPM 软 件 包 格 式 的 Linux 
发 行 版 来 说 ) 是 http://rpmfind.net 和 http://rpm.pbone.net。 你 还 可 以 尝试 一 些 发 行 版 特定 的 软件 
库 ， 如 针对 openSUSE 的 http://ftp.gwdg.de/pub/opensuse/、 针 对 Fedora 的 http://rpm.livna.org 和 针 
对 Slackware 的 http://packages.slackware.it/- 


1. ctags 
ctags 为 程序 中 的 所 有 函数 创建 索引 。 每 个 函数 对 应 一 个 列表 ， 在 列表 中 列 出 该 函数 在 程序 中 的 
调用 位 置 ， 就 像 书籍 的 索引 。 下 面 是 它 的 用 法 : 


ctags [-a] [-f filename] sourcefile sourcefile ... 
ctags -x sourcefile sourcefile ... 


默认 情况 下 ，ccags 在 当前 目录 下 创建 文件 cags。 在 该 文件 中 包含 每 个 输入 源 文件 中 声明 的 每 个 
函数 ， 文 件 中 每 行 的 格式 如 下 所 示 : 

announce app_ui.c /^static void announce(void) / 

文件 中 的 每 行 由 函数 名 、 声 明 该 函数 的 文件 和 一 个 可 以 用 来 在 文件 中 查找 该 函数 定义 的 正则 表达 
式 组 成 。Emacs 等 编辑 器 可 以 用 这 类 文件 来 帮助 程序 员 浏览 源 代码 。 

此 外 ， 还 可 以 使 用 ctags 的 -x 选项 (如 果 你 使 用 的 版 本 有 该 选项 ) 在 标准 输出 上 列 出 类 似 上 面 格 
式 的 内 容 : 

find cat 403 app ui.c static cdc entry find cat( 

你 可 以 用 -ft 选项 将 输出 重 定向 到 另 一 个 不 同 的 文件 中 , 也 可 以 用 -a 选项 将 输出 结果 附加 到 一 个 已 
有 文件 的 结尾 。 

2. cxref 

cxref 程 序 分 析 C 语 言 源 代码 并 生成 一 个 交叉 引用 表 。 它 可 以 显示 每 个 符号 (变量 、#aefine 定 义 
和 函数 ) 都 在 程序 的 哪个 位 置 使 用 过 。 它 生成 的 是 一 个 经 过 排序 的 列表 ， 每 个 符号 的 定义 位 置 用 一 个 
Jy CO 做 标记 ， 如 下 所 示 : 


SYMBOL FILE FUNCTION LINE 
BASENID prog.c - *12 *96 124 126 146 156 166 
BINSIZE prog.c -- *30 197 198 199 206 
BUFMAX prog.c -- *44 45 90 
BUFSIZ /usr/include/stdio.h - +4 
EOF /usr/include/stdio.h -- *27 
arge prog.c -= 36 
prog.c main *37 61 81 
argv prog.c =- 36 
prog.c main *38 6l 
calldata prog.c -- 5 
prog.c main 64 188 
calls prog.c =- $19, 
prog.c main 54 


在 我 的 机 器 上 ， 上 面 的 输出 结果 是 在 一 个 应 用 程序 的 源 代码 目录 中 产生 ， 使 用 的 命令 如 下 所 示 ; 
$ cxref *.c *.h 


但 这 个 命令 的 正确 语法 格式 随 版 本 的 不 同 而 不 同 。 请 参考 系统 文档 或 手册 页 来 了 解 cxref 命 令 的 更 多 
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信息 。 

3. c£1ow 

cflow 程 序 打印 出 一 个 函数 调用 树 (function calltree)， 它 显示 了 函数 之 间 调 用 的 关系 。 它 可 以 让 
我 们 看 清楚 一 个 程序 的 框架 结构 ， 理 解 它 的 操作 流程 ， 了 解 对 某 个 函数 的 改动 将 会 产生 怎样 的 影响 。 
有 些 版 本 的 cflow 除 了 可 以 处 理 源 代码 外 ， 还 可 以 处 理 目标 文件 。 详 细 的 用 法 请 参考 它 的 手册 页 。 

下 面 是 cf1ow 版 本 2.0 的 一 些 样本 输出 ， 该 版 本 可 以 从 因特网 上 得 到 ， 它 由 Marty Leisner 负 责 维护 ; 


1 file ungetc (prcc.c 997) 
2 main (prcc.c 70) 

3 getopt () 

4 show all lists (prcc.c 1070) 
5 display list (prcc.c 1056) 
6 printf () 

7 exit () 

8 exit () 

9 usage (prcc.c 59) 

10 fprintf () 

1i exit () 


这 个 输出 样本 告诉 我 们 ;， main 函数 调用 show_all_liscs 函 数 〈 以 及 其 他 一 此 函数)，show_all 
lists 又 调用 了 display_list， 而 display_list 本 身 调用 了 printf。 

这 个 版 本 的 cflow 有 一 个 -i 选项 ， 它 将 产生 一 个 反 向 的 函数 调用 树 。 针 对 每 个 函数 ，cf1ow 列 出 
调用 它 的 其 他 函数 。 听 起 来 好 像 很 复杂 ， 但 实际 上 很 简单 ， 下 面 是 一 个 样本 。 


19 display list (prcc.c 1056) 


20 Show all lists (prcc.c 1070) 
21 exit () 

22 main (prcc.c 70) 

23 show all lists (prcc.c 1070) 
24 usage (prcc.c 59) 

74 printf. (} 

SAIS display list (prcc.c 1056) 
76 maketag (prcc.c 487) 

T? show all lists (prcc.c 1070) 

78 main (prcc.c 70) 

99 usage (prcc.c 59) 

100 main (prcc.c 70) 


我 们 可 以 看 出 都 有 哪些 函数 调用 了 exir 函 数 ， 它 们 是 main、show_all_lists 和 usage。 
10.4.3 用 proflgprof 产生 执行 存档 


想 查找 程序 的 性 能 问题 时 ， 一 种 常用 的 技巧 是 使 用 执行 存档 Cexecution profiling)。 它 通常 需要 特 
殊 的 编译 器 选项 和 辅助 程序 的 支持 。 程 序 的 执行 存档 可 以 显示 执行 它 所 花费 的 时 间 具 体 都 用 在 什么 操 
作 上 了 。 

编译 程序 时 ， 给 编译 器 加 上 -p 标 志 〈 针 对 prof 程 序 ) 或 -pg 标志 〈 针 对 gprof 程 序 ) 就 可 以 创建 
出 profile 程 序 。 而 prof 程 序 (及 其 GNU 等 效 程序 gprof) 可 以 根据 profile 程 序 运行 时 所 产生 的 执行 跟踪 
文件 打印 出 一 个 报告 。 编 译 命令 如 下 所 示 : 
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$ cc -pg -o program program.c 

程序 用 特殊 版 本 的 C 语 言 函数 库 链 接 起 来 并 且 将 包括 监控 代码 。 不 同 的 系统 具体 实现 方法 有 所 不 
同 ， 但 一 般 都 要 靠 程序 的 频繁 中 断 来 记录 执行 地 点 。 监 控 数 据 将 被 写 入 当前 目录 下 的 文件 non ,out 
《gprof 程 序 用 的 是 gmon .out )。 如 下 所 示 : 

$ ./program 

$ 1s -1s 

2 -rw-r--r-- 1 neil users 1294 Feb 4 11:48 gmon.out 

prof/gprof 程 序 读 取 监控 数据 并 生成 一 个 报告 。 程 序 选项 的 细节 请 参考 它 的 手册 页 。 下 面 是 一 些 

(有 所 删节 ) gprof 程 序 的 输出 示例 : 


cumulative self self total 
time seconds seconds calls ms/call ms/call name 
18.5 0.10 0.10 8664 0.01 0.03 -aoscan [4] 
18.5 0.20 0.10 mcount (60) 
14.8 0.28 0.08 43320 0.00 0.00 -number [5] 
9.3 0.33 0.05 8664 0.01 0.01 format arg [6] 
7.4 0.37 0.04 112632 0.00 0.00 -ungetc [8] 
7.4 0.41 0.04 8757 0.00 0.00 -memccpy [9] 
7.4 0.45 0.04 1 40.00 390.02 -main [2] 
3.7 0.47 0.02 53 0.38 0.38 -read [12] 
Xm 0.49 0.02 wástr [10] 
1.9 0.50 0.01 26034 0.00 0.00 -strlen [16] 
1.9 0.51 0.01 8664 0.00 0.00 strncmp [17] 
10.5 断言 


在 软件 的 开发 过 程 中 , 通过 条 件 编译 引入 printf 调 用 等 调试 代码 的 做 法 是 很 常见 的 , 但 一 般 不 会 
在 发 行 版 本 中 保留 这 些 信息 。 然 而 经 常会 出 现 这 样 的 情况 ， 程 序 运行 中 出 现 的 问题 与 不 正确 的 假设 有 
关 而 并 非 代码 的 错误 。 这 些 不 正确 的 假设 往往 是 被 主观 认为 不 会 发 生 的 事件 。 例如， 人们 在 编写 函数 
时 会 认为 它 的 输入 参数 应 该 位 于 一 个 确定 的 范围 内 ， 但 万 一 给 它 传递 了 不 正确 的 数据 ， 就 可 能 造成 整 
个 系统 运行 不 正常 。 

系统 的 内 部 逻辑 需要 被 确认 没有 错误 。 针对 这 种 情况 ，X/Open 提 供 了 assert 宏 ， 它 的 作用 是 测 
试 某 个 假设 是 否 成 立 ， 如 果 不 成 立 就 停止 程序 的 运行 。 


#include <assert.h> 











void assert (int expression) 

assert 宏 对 表达 式 进行 求 值 ， 如 果 结 果 非 零 ， 它 就 往 标准 错误 写 一 些 诊断 信息 ， 然 后 调用 abort 
函数 结束 程序 的 运行 。 

头 文件 assert .h 定 义 的 宏 受 NDEBUG 的 影响 。 如 果 程 序 在 处 理 这 个 头 文件 时 已 经 定义 了 NDEBUG， 
就 不 定义 assert 宏 。 这 意味 着 ， 你 可 以 在 编译 期 间 使 用 -DNDEBUG 关 闭 断 言 功能 或 把 下 面 这 条 语句 : 


#define NDEBUG 


加 到 每 个 源 文件 中 ， 但 这 条 语句 必须 放 在 #include <assert .h> 语 句 之 前 。 

assert 宏 的 这 种 用 法 带 来 一 个 问题 。 如 果 在 测试 阶段 使 用 assert， 但 在 发 行 版 本 中 将 其 关闭 ， 
那 你 的 发 行 版 本 代码 在 安全 检测 方面 就 比 你 对 它 进行 测试 时 要 差 一 些 。 但 在 产品 代码 中 保留 assert 
通常 是 不 可 取 的 一 一 难道 你 愿意 用 户 在 使 用 你 的 软件 时 在 屏幕 上 显示 一 条 不 友好 的 assert failed 错 
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误 提示 ， 然 后 就 退出 程序 吗 ? 针对 这 个 问题 的 比较 好 的 解决 方法 是 ， 编 写 自己 的 错误 中 断 陷阱 例 程 ， 
在 该 例 程 中 进行 断言 ， 但 不 需要 在 产品 代码 中 完全 禁用 该 功能 。 

你 还 必须 注意 不 要 让 assert 表 达 式 带 上 副作用 。 例 如 ， 如 果 使 用 了 带 有 副作用 的 函数 调用 ， 这 个 
副作用 在 删除 了 断言 功能 的 产品 代码 中 就 不 会 再 发 生 了 。 








下 面 这 个 程序 assert .c 定 义 了 一 个 函数 , 它 的 参数 必须 是 一 个 正 数 。 它 用 断言 功能 来 保护 自己 不 
受 非法 参数 的 影响 。 
该 程序 首先 包括 头 文件 assert .h 然后 定义 一 个 平方 根 函数 , 该 函数 检查 自己 的 参数 是 否 为 正 数 ， 
最 后 是 main 函 数 。 如 下 所 示 : 
#include «stdio.h» 
#include «math.h» 


#include «assert.h» 
#include «stdlib.h» 


double my sqrt(double x) 
t 
assert(x >= 0.0); 
return sqrt (x); 
) 


int main() 
( 
printf(*sqrt +2 = &gWn*, my sqrt(2.0)); 
printf(*'sqrt -2 = %g\n", my sqrt(-2.0)); 
exit(0); 
) 
现在 ,运行 这 个 程序 时 ， 如 果 给 my_sqrt 函 数 传递 了 一 个 非法 值 ， 你 就 会 看 到 一 个 断言 冲突 错误 。 
错误 信息 的 格式 将 随 系统 的 不 同 而 不 同 。 
$ cc -o assert assert.c -lm 
$ ./assert 
sqrt «2 - 1.41421 
assert: assert.c:7: my sqrt: Assertion 'x >= 0.0' failed. 
Aborted 


实验 解析 

当 我 们 试图 用 一 个 负数 来 调用 函数 my_sqrc 时 ， 断 言 失败 了 。assert 宏 给 出 了 发 生 断 言 冲突 的 文 
件 名 和 行 号 , 还 给 出 了 失败 的 条 件 。 程 序 被 一 个 abort 中 断 陷阱 终止 了 运行 , 这 就 是 assert 调 用 abort 
的 结果 。 

如 果 用 -DNDEBUG 选 项 重新 编译 这 个 程序 ， 断 言 功能 将 被 排除 在 编译 结果 之 外 。 当 在 my_sart 函 数 
中 调用 sqrt 函 数 时 ， 得 到 的 将 是 一 个 NaN 值 (不 是 一 个 数字 )， 表 明 一 个 无 效 结果 ， 如 下 所 示 : 

$ ce ~ sert -DNDEBUG assert.c -lm 
$. 
sqrt +2 = 1.41421 
sqrt -2 = nan 
$ 
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一 些 较 旧 的 数学 库 版 本 在 发 生 算术 错误 时 将 产生 一 个 异常 ,程序 将 终止 并 返回 一 个 类 似 Floating 
point exception 的 消息 ， 而 不 是 返回 一 个 NaN。 





10.6 ”内 存 调试 


动态 内 存 分 配 是 一 个 很 容易 出 现 程序 漏洞 的 领域 ， 而 且 一 旦 漏洞 出 现 ， 还 很 难 查 找 。 如 果 在 程序 
中 用 malloc 和 free 函 数 来 分 配 内 存 ， 你 就 必须 清楚 自己 分 配 过 的 每 一 块 内 存 ， 并 且 要 确定 没有 使 用 
已 经 释放 的 内 存 块 ， 这 一 点 非常 重要 。 

内 存 块 通常 都 是 由 malloc 函 数 分 配给 指针 变量 的 。 如 果 指 针 变量 的 取 值 发 生 了 变化 , 又 没有 其 他 
指针 指向 这 块 内 存 ， 这 块 内 存 就 变 得 无 法 访问 。 这 就 是 一 种 内 存 泄漏 现象 ， 它 将 导致 程序 的 长 度 不 断 
增加 。 如 果 泄 漏 了 大 量 内存 ， 系 统 就 会 越 来 越 慢 ， 最 终 耗 尽 内 存 。 

如 果 在 一 个 已 分 配 的 内 存 块 尾部 的 后 面 或 在 它 头 部 的 前 面 ) 写 数 据 ， 就 很 可 能 会 损坏 malloc 
库 用 于 记录 内 存 分 配 情况 的 数据 结构 。 出 现 这 种 情况 后 ， 经 过 一 段 时 间 ， 一 个 malloc 调 用 ， 甚 至 是 
个 free 调 用 都 会 引发 段 错误 并 导致 程序 崩溃 。 要 想 查 出 错误 发 生 的 准确 地 点 是 非常 困难 的 ， 因 为 错误 
可 能 是 在 引发 程序 崩溃 的 事件 之 前 很 久 发 生 的 。 

请 不 要 感到 惊讶 ， 目 前 已 经 有 可 以 帮助 解决 这 两 类 问题 的 工具 了 ， 既 有 商业 版 本 的 也 有 免费 版 本 
的 。malloc 和 free 函 数 也 有 许多 不 同 的 版 本 ， 其 中 一 些 版 本 包含 了 额外 的 代码 ， 用 于 检查 内 存 分 配 
和 内 存 释 放 情 况 ， 以 解决 诸如 一 个 内 存 块 被 释放 了 两 次 以 及 其 他 类 型 的 误 用 。 


10.6.1 ElectricFence 函数 库 


ElectricFence 函 数 库 由 Bruce Perens 开 发 ， 在 一 些 Linux 发 行 版 如 RedHat (企业 版 和 Fedora)、SUSE 
和 openSUSE 中 作为 可 选 组 件 出 现 ， 在 因特网 上 也 很 容易 找到 。 它 尝试 用 Linux 的 虚拟 内 存 机 制 来 保护 
malloc 和 free 所 使 用 的 内 存 ， 当 它 发 现 内 存 被 破坏 时 就 停止 程序 的 运行 。 


ElectricFence 














下 面 这 个 程序 efence.c 调 用 malloc 分 配 了 一 个 内 存 块 ， 然 后 在 这 个 内 存 块 的 尾部 之 后 写 数据 。 
我 们 来 看 看 将 发 生 什么 情况 。 


#include <stdio.h> 
#include <stdlib.h> 


int main() 

t 
char *ptr = (char *) malloc(1024); 
ptr[0] = 0; 


/* Now write beyond the block */ 
ptr(1024] = 0; 
exit(0); 

) 


编译 并 运行 这 个 程序 时 ,我 们 没有 看 到 任何 异常 现象 。 但 是 ,malloc 所 分 配 的 内 存 区 域 可 能 已 遭 
受 一 定 程度 的 破坏 ， 因 此 我 们 迟早 会 遇 到 麻烦 。 
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$ cc -o efence efence.c 
$ ./efence 
$ 


如 果 使 用 同一 个 程序 ， 但 将 它 与 ElectricFence 函 数 库 1ibefence.a 链 接 起 来 ， 那 么 在 运行 这 个 程 
序 时 立刻 就 会 收 到 响应 ， 如 下 所 示 : 

$ ec fence efence.c -lefence 

$ ./efence 





Electric Fence 2.2.0 Copyright (C) 1987-1999 Bruce Perens «bruceéperens.com» 
Segmentation fault 
$ 
我 们 在 调试 器 下 运行 这 个 程序 以 找 出 问题 所 在 : 
$ cc -g -o efence efence.c -lefence 
$ gdb efence 
(gdb) run 
Starting program: /home/neil/BLP4e/chapter10/efence 


Electric Fence 2.2.0 Copyright (C) 1987-1999 Bruce Perens «bruceGperens.com» 


Program received signal SIGSEGV, Segmentation fault. 
[Switching to Thread 1024 (LWP 1869)] 

0x08048512 in main () at efence.c:10 

10 ptr[1024] = 0; 

(gdb) 


实验 解析 

ElectricFence 将 nalloc 及 其 关联 函数 符 换 为 使 用 计算 机 处 理 器 虚拟 内 存 机 制 的 版 本 , 从 而 保护 系统 
不 受 非法 内 存 访问 的 破坏 。 当 出 现 这 类 的 非法 内 存 访问 时 ， 它 会 引发 一 个 段 冲突 信号 并 停止 程序 的 运 
行 。 





10.6.2 valgrind 


valgrind 是 一 个 工具 , 它 有 能 力 检测 出 前 面 讨论 过 的 许多 问题 ,特别 是 它 可 以 检测 出 数组 访问 错 
误 和 内 存 泄漏 。 它 可 能 并 没有 包括 在 你 的 Linux 发 行 版 中 ， 但 可 以 在 http/valgrind.org 上 找到 它 。 

程序 不 需要 重新 编译 就 可 以 使 用 valgrina, 甚至 还 可 以 用 它 来 调试 一 个 正在 运行 程序 的 内 存 访问 
情况 。 这 个 工具 很 值得 一 试 ， 它 已 被 用 在 大 型 软件 如 KDE 版 本 3 的 开发 中 。 


实验 Ê valgrina 


下 面 这 个 程序 checker.c 分 配 了 一 些 内 存 ， 然 后 从 分 配 内 存 以 外 的 区 域 读 取 数据 ， 在 分 配 内 存 尾 
部 之 后 写 数据 ， 最 后 将 该 内 存 区 域 变 得 不 可 访问 。 


#include «stdio.h» 
#include <stdlib.h> 


int main() 

t 
char *ptr = (char *) malloc(1024); 
char ch; 
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/* Uninitialized read */ 

ch = ptr[1024]; 

/* Write beyond the block */ 
ptr[1024] = 0; 





/* Orphan the block */ 
ptr = 
exit(0); 





H 


要 想 使 用 valgrina， 只 需 在 运行 valgrina 时 加 上 一 个 选项 告诉 它 我 们 想 检 查 什么 ， 然 后 将 要 检 
查 的 程序 及 其 参数 〈 如 果 有 的 话 ) 写 在 其 后 。 

用 valgrina 运 行程 序 时 ， 我 们 将 看 到 它 诊断 出 许多 问题 ， 如 下 所 示 : 

$ valgrind --leak-checkeyes -v ./checker 
4780s» Memcheck, a memory error detector. 
4780== Copyright (C) 2002-2007, and GNU GPL'd, by Julian Seward et al. 
47802» Using LibVEX rev 1732, a library for dynamic binary translation. 

Copyright (C) 2004-2007, and GNU GPL'd, by OpenWorks LLP. 

Using valgrind-3.2.3, a dynamic binary instrumentation framework. 
Copyright (C) 2000-2007, and GNU GPL'd, by Julian Seward et al. 





22478 


. /checker 
Startup, with flags: 
--leak-checkeyes 
-v 
Contents of /proc/version: 
--4780-- Linux version 2.6.20.2-2-default (geeko@buildhost) (gcc version 4.1.3 
20070218 (prerelease) (SUSE Linux)) #1 SMP Fri Mar 9 21:54:10 UTC 2007 
--4780-- Arch and hwcaps: X86, x86-ssel-sse2 
Page sizes: currently 4096, max supported 4096 
Valgrind library directory: /usr/lib/valgrind 
Reading syms from /lib/ld-2.5.so (0x4000000) 
Reading syms from /home/neil/BLP4e/chapterlü/checker (0x8048000) 
Reading syms from /usr/lib/valgrind/x86-linux/memcheck (0x38000000) 
Object doesn't have a symbol table 
Object doesn't have a dynamic symbol table 
Reading suppressions file: /usr/lib/valgrind/default.supp 
REDIR: 0x40158B0 (index) redirected to 0x38027EDB (???) 
--4780-- Reading syms from /usr/lib/valgrind/x86-linux/vgpreload core.so 
(0x401E000) 
--4780-- ^ object doesn't have a symbol table 
--4780-- Reading syms from /usr/lib/valgrind/x86-linux/vgpreload, memcheck.so 
(0x4021000) 
--4780-- object doesn't have a symbol table 
WARNING: new redirection conflicts with existing -- ignoring it 
new: 0x040158B0 (index ) R-» 0x04024490 index 
REDII 0x4015A50 (strlen) redirected to 0x4024540 (strlen) 
Reading syms from /lib/libc-2.5.so (0x4043000) 
REDIR: Ox4ÜADFFO (rindex) redirected to 0x4024370 (rindex) 
REDIR: Ox40AAF00 (malloc) redirected to 0x4023700 (malloc) 
==4780== Invalid read of size 1 
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at 0x804842C: main (checker.c:10) 
Address 0x4170428 is 0 bytes after a block of size 1,024 alloc'd 
at 0x4023785: malloc (in /usr/lib/valgrind/x86- 
linux/vgpreload memcheck.so) 
by 0x8048420: main (checker.c:6) 





Invalid write of size 1 
at 0x804843A: main (checker.c:13) 
Address 0x4170428 is 0 bytes after a block of size 1,024 alloc'd 
at 0x4023785: malloc (in /usr/lib/valgrind/x86- 
linux/vgpreload memcheck.so) 
by 0x8048420: main (checker.c:6) 
REDIR: Ox40A8BBO (free) redirected to 0x402331A (free) 
--4780-- REDIR: Ox40AEE70 (memset) redirected to 0x40248A0 (memset) 








ERROR SUMMARY: 2 errors from 2 contexts (suppressed: 3 from 1) 





1 errors in context 1 of 2: 

4780-- Invalid write of size 1 

478 at 0x804843A: main (checker.c:13) 

4780== Address 0x4170428 is 0 bytes after a block of size 1,024 alloc'd 
4780== at 0x4023785: malloc (in /usr/lib/valgrind/x86- 
linux/vgpreload memcheck.so) 

by 0x8048420: main (checker.c:6) 





Invalid read of size 1 
at 0x804842C: main (checker.c:10) 
Address 0x4170428 is 0 bytes after a block of size 1,024 alloc'd 
at 0x4023785: malloc (in /usr/lib/valgrind/x86- 
linux/vgpreload memcheck.so) 
4780-- by 0x8048420: main (checker.c:6) 
--4780-- 








supp: 3 di-hack3 
IN SUMMARY: 2 errors from 2 contexts (suppressed: 3 from 1) 


malloc/free: in use at exit: 1,024 bytes in 1 blocks. 
malloc/free: 1 allocs, 0 frees, 1,024 bytes allocated. 


searching for pointers to 1 not-freed blocks. 
checked 65,444 bytes. 


1,024 bytes in 1 blocks are definitely lost in loss record 1 of 1 
at 0x4023785: malloc (in /usr/lib/valgrind/x86- 

linux/vgpreload memcheck.so) 

by 0x8048420: main (checker.c:6) 





LEAK SUMMARY: 
definitely lost: 1,024 bytes in 1 blocks. 
possibly lost: 0 bytes in 0 blocks. 
still reachable: 0 bytes in 0 blocks. 
Suppressed: 0 bytes in 0 blocks. 


















--4780-- memcheck: sanity checks: 0 cheap, 1 expensive 

--4780-- memcheck: auxmaps: 0 auxmap entries (0k, 0M) in use 

--4780-- memcheck: auxmaps: 0 searches, 0 comparisons 

--4780-- memcheck: SMs: n issued = 9 (144k, 0M) 

--4780-- memcheck: SMs: n deissued (0k, OM) 

--4780-- memcheck: SMs: max noaccess 5535 (1048560k, 1023M) 

--4780-- memcheck: SMs: max undefine (0k, OM) 

--4780-- memcheck: SMs: max defined 9 (304k, OM) 

--4780-- memcheck: SMs: max non DSM (144k, OM) 

--4780-- memcheck: max sec V bit nodes: 0 (0k, OM) 

--4780-- memcheck: set sec vbits8 calls: 0 (new: 0, updates: 0) 
--4780-- memcheck: max shadow mem size: 448k, 0M 

--4780-- translate: fast SP updates identified: 1,456 ( 90.3%) 
--4780-- translate: — generic known SP updates identified: 79 ( 4.9%) 
--4780-- translate: generic unknown SP updates identified: 76 ( 4.7%) 
--4780-- tt/tc: 3,341 tt lookups requiring 3,360 probes 

--4780-- tt/tc: 3,341 fast-cache updates, 3 flushes 

--4780-- transtab: new 1,553 (33,037 -> 538,097; ratio 162:10) [0 scs] 


--4780-- transtab: dumped 0 (0 -» ??) 

--4780-- transtab: discarded 6 (143 -> ??) 

scheduler: 21,623 jumps (bb entries]. 

Scheduler: 0/1,828 major/minor sched events. 
sanity: 1 cheap, 1 expensive checks. 
exectx: 30,011 lists, 6 contexts (avg 0 per list) 
exectx: 6 searches, 0 full compares (0 per 1000) 
exectx: 0 cmp2, 4 cmp4, 0 cmpAll 





我 们 看 到 它 查 出 了 错误 的 读 写 操作 ， 
调试 器 在 错误 地 点 中 断 程序 的 运 和 

valgrinG 有 许多 选项 , 包括 对 特定 类 型 错误 的 抑制 和 内 存 泄漏 的 检测 。 要 想 检测 程序 的 内 存 泄漏 
问题 ， 我 们 必须 使 用 valgrina 的 一 个 选项 。 如 果 想 在 程序 运行 结束 时 进行 内 存 泄漏 的 检查 ， 需 要 指定 
选项 --leak-check=yes。 我 们 可 以 用 命令 valgrina --help 获 得 完整 的 选项 列表 。 

我 们 的 程序 在 valgrina 的 控制 下 执行 ， 它 中 途 截获 程序 执行 的 各 种 操作 并 进行 许多 检查 工作 ,， 包 
括 内 存 访问 的 检查 。 如 果 该 访问 操作 涉及 一 个 已 分 配 的 内 存 块 并 且 是 非法 的 访问 ,valgrina 将 打印 出 
消息 。 在 程序 执行 结束 时 ， 它 将 运行 一 个 垃圾 收集 例 程 来 检测 是 否 有 已 分 配 的 内 存 块 未 被 释放 。 如 果 
有 ， 它 将 报告 这 些 被 遗弃 的 内 存 块 。 





寺 还 给 出 了 与 之 对 应 的 内 存 块 及 其 分 配 位 置 。 我 们 可 以 用 








10.7 小 结 


在 本 章 中 ， 我 们 介绍 了 一 些 调试 工具 和 技巧 。Linux 提 供 了 一 些 功能 强大 的 工具 帮助 我 们 修复 程 
序 中 的 漏洞 。 我 们 用 gab 消 除了 示例 程序 中 的 漏洞 ， 并 介绍 了 一 些 静态 分 析 工 具 ， 如 cflow 和 splint。 
最 后 ， 我 们 对 使 用 动态 内 存 分 配 可 能 出 现 的 问题 进行 了 讨论 ， 并 介绍 了 一 些 可 以 帮助 我 们 诊断 它们 的 
工具 ， 如 ElectricFence 和 valgrind。 

在 本 章 中 讨论 的 大 多 数 工 具 都 可 以 在 因特网 上 的 FTP 服 务 器 中 找到 。 我 们 关心 的 是 在 某 些 情况 下 
需要 注意 保留 版 权 信 息 。 其 中 许多 工具 的 信息 都 取 自 Linux 档 案 网 站 http://www.ibiblio.org/pub/Linux。 
我 们 希望 最 新 发 布 的 版 本 也 可 以 在 该 网 址 找到 。 
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1 并 程 和 信号 构成 了 Linux 操 作 环 境 的 基础 部 分 。 它 们 控制 着 Linux 和 所 有 其 他 类 UNIX 计 算 机 系 
统 执行 的 几乎 所 有 活动 。 不 管 是 对 于 系统 程序 员 、 应 用 程序 员 还 是 系统 管理 者 ， 理 解 Linux 
和 UNIX 系 统 的 进程 管理 都 是 很 有 好 处 的 。 

在 本 章 中 ， 我 们 将 看 到 Linux 环 境 中 的 进程 是 如 何 被 管理 的 ， 怎 样 才能 知道 计算 机 在 任 一 给 定时 
刻 在 做 些 什么 。 我 们 还 将 介绍 如 何 才 能 在 自己 的 程序 中 启动 和 停止 其 他 的 进程 , 如 何 让 进程 收发 消息 ， 
如 何 避 免 僵尸 进程 等 内 容 。 具 体 地， 我 们 将 介绍 以 下 几 方面 的 内 容 : 

口 进程 的 结构 、 类 型 和 调度 

O 用 不 同 的 方法 启动 新 进程 

O 父 进程 、 子 进程 和 伪 尸 进程 

口 什么 是 信号 以 及 如 何 使 用 它们 


111 什么 是 进程 


UNIX 标 准 (特别 是 IEEE Std 1003.1, 2004 年 版 ) 把 进程 定义 为 :“ 一 个 其 中 运行 着 一 个 或 多 个 线程 
的 地 址 空间 和 这 些 线程 所 需要 的 系统 资源 。” 我 们 将 在 第 12 章 介绍 线程 。 目 前 ， 可 以 把 进程 看 作 正在 
运行 的 程序 。 

像 Linux 这 样 的 多 任务 操作 系统 可 以 同时 运行 多 个 程序 。 每 个 运行 着 的 程序 实例 就 构成 一 个 进程 。 
在 X 视 窗 系统 〈 通 常 简称 为 X) 等 视窗 化 系统 中 这 一 特点 尤为 明显 。 如 同 微软 的 Windows 系 统 ，X 视 窗 
系统 提供 了 一 个 图 形 化 的 用 户 界面 ， 它 允许 同时 运行 多 个 应 用 程序 ， 每 个 应 用 程序 可 以 在 一 个 或 多 个 
窗口 中 显示 。 

作为 多 用 户 系统 ，Linux 人 允许 许多 用 户 同时 访问 系统 。 每 个 用 户 可 以 同时 运行 许多 个 程序 ， 其 至 
同时 运行 同一 个 程序 的 许多 个 实例 。 系 统 本 身 也 运行 着 一 些 管 理 系统 资源 和 控制 用 户 访问 的 程序 。 

正如 我 们 在 第 4 章 看 到 的 ， 正 在 运行 的 程序 或 进程 由 程序 代码 、 数 据 、 变 量 〈 占 用 着 系统 内 存 )、 
打开 的 文件 (文件 描述 符 ) 和 环境 组 成 。 一 般 来 说 ，Linux 系 统 会 在 进程 之 间 共 享 程序 代码 和 系统 函 
数 库 ， 所 以 在 任何 时 刻 内 存 中 都 只 有 代码 的 一 份 副本 。 


11.2 ”进程 的 结构 


我 们 来 看 看 操作 系统 是 如 何 管理 多 个 进程 的 。 如 果 有 两 个 用 户 neil 和 rick， 他 们 同时 运行 arep 
程序 在 不 同 的 文件 中 查找 不 同 的 字符 串 。 他 们 使 用 的 进程 如 图 11-1 所 示 。 





11.2 进程 的 结构 389 









































„neil rick. 
$ grep kirk trek.txt. $ grep troi nextgen.doc 
PID 101 PID 102 
代码 a — 代码 
数据 数据 
s= "kirk" s= "troi" 
函数 库 | 一 一 |C 语 言 孙 数 库 上 ;一 一 | 函数 库 
文件 文件 
trek.txt nextgen.doc 
图 na 
如 果 在 搜索 结束 之 前 运行 ps 命令 ， 则 该 命令 输出 类 似 下 面 这 样 的 内 容 : 
$ ps -ef 
UID PID PPID C STIME TTY TIME CMD 


rick 101 96 0 18:24 tty2 00:00:00 grep troi nextgen.doc 
neil 102 92 0 18:24 tty4 00:00:00 grep kirk trek.txt 


每 个 进程 都 会 被 分 配 一 个 唯一 的 数字 编号 ， 我 们 称 之 为 进程 标识 符 或 PID。 它 通常 是 一 个 取 值 范 
围 从 2 到 32 768 的 正 整数 。 当 进程 被 启动 时 ， 系 统 将 按 顺序 选择 下 一 个 未 被 使 用 的 数字 作为 它 的 PID， 
当 数 字 已 经 回 绕 一 圈 时 ， 新 的 PID 重 新 从 2 开始 。 数 字 1 一 般 是 为 特殊 进程 init 保 留 的 ，init 进 程 负责 
管理 其 他 进程 ,我 们 很 快 就 会 再 次 谈 到 它 。 这 里 我 们 可 以 看 到 由 用 户 neil 和 rick 启 动 的 两 个 进程 被 分 
配 的 PID 分 别 是 101 和 102。 

将 要 被 grep 命 令 执 行 的 程序 代码 被 保存 在 一 个 磁盘 文件 中 。 正 常情 况 下 ，Linux 进 程 不 能 对 用 来 
存放 程序 代码 的 内 存 区 域 进行 写 操作 ， 即 程序 代码 是 以 只 读 方 式 加 载 到 内 存 中 的 。 我 们 从 图 11-1 中 可 
以 看 到 ， 虽 然 不 能 对 这 个 区 域 执行 写 操作 ， 但 它 可 以 被 多 个 进程 安全 地 共享 。 

系统 函数 库 也 可 以 被 共享 。 例 如， 不 管 有 多 少 个 正在 运行 的 程序 要 调用 printf 函 数 ， 内 存 中 只 要 
有 它 的 一 份 副本 即 可 。 这 种 做 法 与 微软 Windows 操 作 系统 中 使 用 的 动态 链接 库 (DLL) 机 制 类 似 ， 但 
更 加 复杂 。 

从 上 图 中 还 可 以 看 出 ， 共 享 函 数 库 带 来 的 另 一 个 优点 是 ， 包 含 可 执行 程序 grep 的 磁盘 文件 容量 比 
较 小 ， 因 为 它 不 包含 共享 函数 库 代 码 。 这 对 一 个 单独 的 程序 来 说 ， 算 不 上 大 优点 ， 但 对 整个 操作 系统 
来 说 ， 把 常用 例 程 提取 出 来 放 入 《比如 说 ) C 语 言 的 标准 函数 库 中 将 节省 大 量 的 磁盘 空间 。 

当然 ， 并 不 是 程序 在 运行 时 所 需要 的 所 有 东西 都 可 以 被 共享 。 例 如 ， 进 程 使 用 的 变量 就 与 其 他 进 
程 所 使 用 的 截然 不 同 。 在 本 例 中 ， 传 递 给 grep 程 序 的 搜索 字符 串 以 变量 s 的 形式 出 现在 每 个 进程 的 数 
据 区 中 。 它 们 之 间 是 分 离 的 ， 通 常 不 能 被 其 他 进程 读 取 。 这 两 个 grep 命 令 所 使 用 的 文件 也 各 不 相同 ， 
进程 通过 各 自 的 文件 描述 符 来 访问 文件 。 

除 此 之 外 ， 进 程 有 自己 的 栈 空间 ， 用 于 保存 函数 中 的 局 部 变量 和 控制 函数 的 调用 与 返回 。 进 程 还 
有 自己 的 环境 空间 ， 包 含 专门 为 这 个 进程 建立 的 环境 变量 ， 我 们 在 第 4 章 介绍 putenv 和 getenv 函 数 时 
已 用 过 这 些 环境 变量 。 进 程 还 必须 维护 自己 的 程序 计数 器 ， 这 个 计数 器 用 来 记录 它 执 行 到 的 位 置 ， 即 
在 执行 线程 中 的 位 置 。 我 们 将 在 下 一 章 看 到 ， 在 使 用 线程 时 ， 进 程 可 以 有 不 止 一 个 执行 线程 。 

在 许多 Linux 系 统 〔( 也 包括 一 些 UNIX 系 统 ) 上 ， 在 目录 /proc 中 有 一 组 特殊 的 文件 ， 这 些 文件 的 
特殊 之 处 在 于 它们 允许 你 “窥视 ”正在 运行 的 进程 的 内 部 情况 ,就 好 像 这 些 进程 是 目录 中 的 文件 一 样 。 
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我 们 在 第 3 章 已 简单 介绍 过 /proc 文 件 系统 了 。 
最 后 ， 因 为 Linux 和 UNIX 一 样 ， 有 一 个 虚拟 内 存 系统 ， 能 够 把 程序 代码 和 数据 以 内 存 页 面 的 形式 
放 到 硬盘 的 一 个 区 域 中 ， 所 以 Linux 可 以 管理 的 进程 比 物理 内 存 所 能 容纳 的 要 多 得 多 。 


11.2.1 进程 表 


Linux 进 程 表 就 像 一 个 数据 结构 ， 它 把 当前 加 载 在 内 存 中 的 所 有 进程 的 有 关 信 息 保存 在 一 个 表 中 ， 
其 中 包括 进程 的 PID、 进 程 的 状态 、 命 令 字 符 串 和 其 他 一 些 ps 命令 输出 的 各 类 信息 。 操 作 系 统 通过 进 
程 的 PID 对 它们 进行 管理 ， 这 些 PID 是 进程 表 的 索引 。 进 程 表 的 长 度 是 有 限制 的 ， 所 以 系统 能 够 支持 的 
同时 运行 的 进程 数 也 是 有 限制 的 。 早 期 的 UNIX 系 统 只 能 同时 运行 256 个 进程 。 最 新 的 实现 版 本 已 大 幅 
度 放宽 这 一 限制 ， 可 以 同时 运行 的 进程 数 可 能 只 与 用 于 建立 进程 表 项 的 内 存 容量 有 关 ， 而 没有 具体 的 
数字 限制 了 。 


11.22 ”查看 进程 
ps 命令 可 以 显示 我 们 正在 运行 的 进程 、 其 他 用 户 正在 运行 的 进程 或 者 目前 在 系统 上 运行 的 所 有 进 











Fé. 下面 是 ps 命令 的 输出 样本 : 
$ ps -ef 
UID PID PPID C STIME TTY TIME CMD 
root 433 425 0 18:12 ttyl [bash] 
rick 445 426 0 18:12 tty2 -bash 
rick 456 427 0 18:12 tty3 [bash] 
root 467 433 0 18:12 ttyl Sh /usr/Xl11R6/bin/startx 
root 474 467 0 18:12 ttyl xinit /etc/Xll/xinit/xinitrc -- 
root 478 474 0 18:12 ttyl /usr/bin/gnome-session 
root 487 1 0 18:12 ttyl gnome-smproxy --sm-client-id def 
root 493 1 0 18:12 ttyl [enlightenment] 
root 506 1 0 18:12 ttyl panel --sm-client-id default8 
root 508 1 0 18:12 ttyl Xscreensaver -no-splash -timeout 
root 510 1 0 18:12 ttyl gmc --sm-client-id default10 
root 512 1 0 18:12 ttyl gnome-help-browser --sm-client-i 
root 649 445 0 18:24 tty2 00:00:00 su 
root 653 649 0 18:24 tty2 00:00:00 bash 
neil 655 428 0 18:24 tty4 00:00:00 -bash 
root 713 1 2 18:27 ttyl 00:00:00 gnome-terminal 
root 715 713 0 18:28 ttyl gnome-pty-helper 
root 717 716 13 18:28 pts/0 emacs 
root 718 653 0 18:28 tty2 00:00:00 ps -ef 


这 个 命令 显示 了 许多 进程 的 相关 信息 ， 包 括 在 X 视 窗 系统 中 运行 的 Emacs 编辑 器 。 例 如 ，TTY 一 列 
显示 了 进程 是 从 哪 一 个 终端 启动 的 ，TIME 一 列 是 进程 目前 为 止 所 占用 的 CPU 时 间 ，cwp 一 列 显示 启动 
进程 所 使 用 的 命令 。 下 面 我 们 来 仔细 查看 其 中 的 一 些 进程 信息 。 

neil 655 428 0 18:24 tty4 00:00:00 -bash 

用 户 的 初始 登录 是 在 第 4 个 虚拟 终端 完成 的 。 该 终端 是 这 台 机 器 的 一 个 主 控 台 。 运 行 的 shell 程 序 
是 Linux 系 统 的 默认 shell，bash。 

root 467 433 0 18:12 ttyl 00:00:00 sh /usr/X11R6/bin/startx 

X 视 窗 系统 是 由 命令 startx 启 动 的 。 该 命令 是 一 个 shell 脚 本 , 它 启 动 X 服 务 器 并 运行 一 些 初始 化 X 
视窗 系统 的 程序 。 


11.2 进程 的 结构 391 





root 717 716 13 18:28 pts/0 00:00:01 emacs 

这 个 进程 代表 着 X 视 窗 系 统 中 一 个 运行 着 Emacs 编辑 器 的 窗口 。 它 是 由 窗口 管理 器 响应 一 个 创建 新 
窗口 的 请 求 而 启动 的 。 系 统 还 分 配给 shell 一 个 新 的 伪 终 端 pcs/0，shell 可 以 通过 该 终端 进行 读 写 操作 。 

root 512 1 0 18:12 ttyl 00:00:01 gnome-help-browser --sm-client-i 

这 是 由 窗口 管理 器 启动 的 GNOME 帮 助 信息 浏览 器 。 

默认 情况 下 ，ps 程 序 只 显示 与 终端 、 主 控 台 、 串 行 口 或 伪 终 端 保持 连接 的 进程 的 信息 。 其 他 进程 
在 运行 时 不 需要 通过 终端 与 用 户 进行 通信 ， 它 们 通常 都 是 一 些 系 统 进 程 ，Linux 用 它们 来 管理 共享 的 
资源 。 我 们 可 以 用 ps 命令 的 -a 选项 查看 所 有 的 进程 ， 用 -f 选 项 显示 进程 完整 的 信息 。 

ps 命令 的 精确 语法 及 其 输出 内 容 的 格式 随 系统 的 不 同 而 稍 有 变化 。Linux 使 用 的 GNU 版 

本 的 ps 命令 支持 来 自 以 前 几 个 ps 命令 实现 版 本 中 的 选项 ( 包括 来 自 UNIX 变 体 BSD 和 AT&T 

中 ps 命令 的 选项 ) ， 并 且 它 还 新 增 了 一 些 选项 有 关 ps 命 令 可 使 用 的 选项 和 输出 格式 的 更 多 

细节 请 参考 其 手册 . 


11.23 ”系统 进程 


下 面 显示 的 是 运行 在 另 一 台 Linux 系 统 上 的 一 些 进程 。 为 清楚 起 见 ， 我 们 对 输出 结果 进行 了 简化 。 
在 下 面 的 例子 中 , 你 将 看 到 如 何 查看 进程 的 状态 ,ps 命令 输出 中 的 srAT 一 列 用 来 表明 进程 的 当前 状态 。 
常见 的 sSTAT 代 码 见 表 11-1。 其 中 一 些 代码 的 含义 将 随 着 本 章 后 面 的 介绍 变 得 更 加 清晰 ， 而 另 一 些 代码 
则 超出 了 本 书 介绍 的 范围 ， 你 可 以 安全 地 忽略 它们 。 


表 11-1 






STAT 代 码 说 A 

s BHR. BAERE NORE, 1 A CO BCRPR A TI 
R 运行 严格 来 说 ， 应 是 “可 运行 "， 即 在 运行 队列 中 ， 处 于 正在 执行 或 即将 运行 状态 
D 不 可 中 断 的 睡眠 〈 等 待 )。 通 常 是 在 等 待 输入 或 输出 完成 
T 停止 。 通 常 是 被 shell 作 业 控制 所 停止 ， 或 者 进程 正 处 于 调试 器 的 控制 之 下 
z JE (Defunct) 进程 或 僵尸 Crombie) 进程 
N 低 优先 级 任务 ，nice 
w 
5 
n 








分 页 。( 不 适用 于 246 版 本 开始 的 Linux 内 核 ) 
进程 是 会 话 期 首 进程 

进程 属于 前 台 进 程 组 

进程 是 多 线程 的 

高 优先 级 任务 





PID TTY STAT TIME COMMAND 
03 init [5] 

00 [migration/0] 

00 [ksoftirqd/0] 

05 [events/0] 

:00 [khelper] 

00 [kthread] 

52 [kjournald] 

03 /sbin/udevd --daemon 


Hu 
ov»oooooo 
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3069 ? Ss /sbin/acpid 
3098 ? Ss /usr/sbin/hald --daemon=yes 
3099 ? S hald-runner 
8357 ? Ss /sbin/syslog-ng 
8677 ? Ss /opt/kde3 /bin/kdm 
9119 ? s konsole [kdeinit] 
9120 pts/2 Ss /bin/bash 
9151 ? Ss /usr/sbin/cupsd 
9457 ? Ss /usr/sbin/cron 
9479 ? Ss /usr/sbin/sshd -o PidFile-/var/run/sshd.init.pid 
9618 ttyl Ss+ /sbin/mingetty --noclear ttyl 
9619 tty2 Ss+ /sbin/mingetty tty2 
9621 tty3 Ss+ /sbin/mingetty tty3 
9622 tty4 Ss+ /sSbin/mingetty tty4 
9623 tty5 Ss+ 0:00 /sbin/mingetty tty5 
9638 tty6 Ss* 0:00 /sbin/mingetty tty6 
10359 tty? Ss+ 10:05 /usr/bin/Xorg -br -nolisten tcp :0 vt7 -auth 
10360 ? s 0:00 -:0 
10381 ? Ss 0:00 /bin/sh /usr/bin/kde 
10438 ? Ss 0:00 /usr/bin/ssh-agent /bin/bash /etc/Xll/xinit/xinitrc 
10478 ? s 0:00 start kdeinit --new-startup *kcminit startup 
10479 ? Ss 0:00 kdeinit Running... 
10500 ? s 0:53 kdesktop [kdeinit] 
10502 ? s 1:54 kicker [kdeinit] 
10524 ? Sl 0:47 beagled /usr/lib/beagle/BeagleDaemon.exe --bg 
10530 ? s 0:02 opensuseupdater 
10539 ? s 0:02 kpowersave [kdeinit] 
10541 ? s 0:03 klipper [kdeinit] 
10555 ? Li 0:01 kio uiserver [kdeinit] 
10688 ? Ei 0:53 konsole [kdeinit] 
10689 pts/l Ss+ 0:07 /bin/bash 
10784 ? s 0:00 /opt/kde3/bin/kdesud 
11052 ? s 0:01 [pdflush] 
19996 ? SN1 0:20 beagled-helper /usr/lib/beagle/IndexHelper.exe 
20254 ? Li 0:00 qmgr -1 -t fifo -u 
21192 ? Ss 0:00 /usr/sbin/ntpd -p /var/run/ntp/ntpd.pid -u ntp -i /v 
21198 ? s 0:00 pickup -1 -t fifo -u 
21475 pts/2 R+ 0:00 ps ax 


我 们 在 这 里 看 到 了 一 个 非常 重要 的 进程 。 


i, "E 


Ss 


0:03 init [5] 


一 般 而 言 ， 每 个 进程 都 是 由 另 一 个 我 们 称 之 为 父 进程 的 进程 启动 的 ， 被 父 进程 启动 的 进程 叫做 子 
进程 。Linux 系 统 启动 时 ， 它 将 运行 一 个 名 为 init 的 进程 ， 该 进程 是 系统 运行 的 第 一 个 进程 ， 它 的 进 
程 号 为 1。 你 可 以 把 init 进 程 看 作为 操作 系统 的 进程 管理 器 ， 它 是 其 他 所 有 进程 的 祖先 进程 。 我 们 将 
要 看 到 的 其 他 系统 进程 要 么 是 由 init 进 程 启动 的 ， 要 么 是 由 被 init 进 程 启动 的 其 他 进程 启动 的 。 

用 户 登录 的 处 理 过 程 就 是 一 个 这 样 的 例子 . init 进 程 为 每 个 用 户 用 来 登录 的 串 行 终端 或 拨号 调制 
解 调 器 启动 一 次 getty 程 序 。 对 应 的 ps 命令 输出 如 下 所 示 : 


9619 tty2 


Ss 


0:00 /sbin/mingetty tty2 


getty 进 程 等 待 来 自 终端 的 操作 ， 向 用 户 显示 熟悉 的 登录 提示 符 ， 然 后 把 控制 移交 给 登录 程序 ， 登 
录 程序 设置 用 户 环境 ， 最 后 启动 一 个 shell。 用 户 退 出 系统 时 ，init 进 程 将 再 次 启动 另 一 个 get ty 进程 。 
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启动 新 进程 并 等 待 它们 结束 的 能 力 是 整个 系统 的 基础 。 我 们 将 在 本 章 的 后 面 看 到 如 何 从 自己 的 程 
序 中 用 系统 调用 fork、exec 和 wait 来 完成 同样 的 任务 。 


11.24 ”进程 调度 


ps 命令 的 输出 结果 中 还 有 一 条 对 应 ps 命令 本 身 的 记录 : 

21475 pts/2 R+ 0:00 ps ax 

这 行 表明 进程 21475 处 于 运行 状态 〈R)， 正 在 执行 的 命令 是 ps ax。 也 就 是 说 ， 这 个 进程 出 现在 自 
己 的 输出 结果 中 了 。 这 个 状态 指示 符 只 表示 程序 已 准备 好 运行 ， 并 不 意味 着 它 正在 运行 。 在 一 台 单 处 
理 器 计算 机 上 ， 同 一 时 间 只 能 有 一 个 进程 可 以 运行 ， 其 他 进程 处 于 等 待 运行 状态 。 每 个 进程 轮 到 的 运 
行 时 间 (我 们 称 之 为 时 间 片 ) 是 相当 短暂 的 ， 这 就 给 人 一 种 多 个 程序 在 同时 运行 的 假象 。 状 态 R+ 只 表 
示 这 个 程序 是 一 个 前 台 任务 ， 它 不 是 在 等 待 其 他 进程 结束 或 等 待 输入 输出 操作 完成 。 这 就 是 为 什么 你 
可 能 会 在 ps 命令 的 输出 结果 中 看 到 两 个 这 样 的 进程 的 原因 ( 另 一 个 常见 的 标记 为 正在 运行 的 进程 是 X 
显示 服务 器 )。 

Linux 内 核 用 进程 调度 器 来 决定 下 一 个 时 间 片 应 该 分 配给 哪个 进程 。 它 的 判断 依据 是 进程 的 优先 
级 〈 我 们 在 第 4 章 已 讨论 过 优先 级 的 概念 )。 优 先 级 高 的 进程 运行 得 更 为 频繁 。 而 其 他 进程 ， 如 低 优先 
级 的 后 台 任务 运行 的 就 不 是 非常 频繁 。 在 Linux 中 ， 进 程 的 运行 时 间 不 可 能 超过 分 配给 它们 的 时 间 片 ， 
它们 采用 的 是 抢先 式 多 任务 处 理 , 所 以 进程 的 挂 起 和 继续 运行 无 需 彼此 之 间 的 协作 。 但 早 一 些 的 系统 ， 
如 微软 的 Windows 3.x， 通 常 需要 进程 明确 地 退出 时 间 片 ， 然 后 其 他 进程 才能 继续 运行 。 

在 一 个 如 Linux 这 样 的 多 任务 系统 中 ， 多 个 程序 可 能 会 竞争 使 用 同一 个 资源 。 在 这 种 情况 下 ， 执 
行 短期 的 突 发 性 工作 并 暂停 运行 来 等 待 输入 的 程序 ， 要 比 持续 占用 处 理 器 来 进行 计算 或 不 断 轮 询 系统 
来 查看 是 否 有 新 的 输入 到 达 的 程序 要 更 好 。 我 们 称 表现 良好 的 程序 为 mice 程序 ， 而 且 在 某 种 意义 上 ， 
这 个 nice 是 可 以 被 计算 出 来 的 。 操 作 系统 根据 进程 的 nice 值 来 决定 它 的 优先 级 ， 一 个 进程 的 nice 值 默 
认为 0 并 将 根据 这 个 程序 的 表现 而 不 断 变化 。 长 期 不 间断 运行 的 程序 的 优先 级 一 般 会 比较 低 。 而 (例如) 
暂停 来 等 待 输入 的 程序 会 得 到 奖励 。 这 可 以 帮助 与 用 户 进行 交互 的 程序 保持 及 时 的 响应 性 。 在 程序 等 
待 用 户 的 输入 时 ， 系 统 会 增加 它 的 优先 级 ， 这 样 ， 当 它 准备 继续 运行 时 ， 它 就 会 有 比较 高 的 优先 级 而 
能 优先 执行 。 我 们 可 以 用 nice 命 令 设 置 进程 的 nice 值 ， 使 用 renice 命 令 调整 它 的 值 。ni ce 命令 是 将 
进程 的 nice 值 增加 10， 从 而 降低 该 进程 的 优先 级 。 我 们 可 以 用 ps 命令 的 -1 或 -f (长 格式 输出 ) 选项 查 
看 正在 运行 的 进程 的 nice 值 。 我 们 感 兴趣 的 值 列 在 NI (nice) 一 栏 ， 如 下 所 示 : 





FS UID PID PPID C 
500 1259 1254 0 
500 1262 1251 0 75 
0 
2 


NI ADDR SZ WCHAN TTY 

s 0 

S 0 
000 S 500 1313 1262 75 0 
s 0 

R 0 

) 


- 710 wait4 pts/2 
714 wait4 pts/1 
2762 schedu pts/1 
789 schedu pts/1 
782 - pts/1 00:00:00 ps 


正在 以 默认 的 nice 值 运行 。 如 果 我 们 用 下 面 的 命令 来 启 


500 1362 1262 
500 1363 1262 0 81 


我 们 看 到 oclock 程 序 ( 进 程 号 为 1362 
动 它 : 

$ nice oclock & 
它 将 分 配 到 一 个 +10 的 nice 值 。 如 果 用 下 面 的 命令 调整 这 个 值 : 


$ renice 10 1362 
1362: old priority 0, new priority 10 
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这 个 时 钟 程序 运行 得 就 会 不 那么 频繁 了 。 我 们 可 以 再 用 ps 命令 查看 修改 过 的 nice 值 ， 如 下 所 示 : 
$ ps -1 





FS UID PID PPID C PRI NI ADDR SZ WCHAN TTY TIME CMD 
000 S 500 1259 1254 0 75 0- 710 wait4 pts/2 00:00:00 bash 
000 S 500 1262 1251 0 75 0- 714 wait4 pts/1 
000 S 500 1313 1262 0 75 0 - 2762 schedu pts/1 
000 S 500 1362 1262 0 90 10- 789 schedu pts/1 
000 R 500 1365 1262 0 81 0- 782 - pts/1 
状态 栏 sTAT 中 包含 字符 N 表 明 这 个 进程 的 nice 值 已 被 修改 过 ， 己 经 不 是 默认 值 了 。 
$ ps x 

PID TTY STAT TIME COMMAND 
1362 pts/1 SN 0:00 oclock 


ps 命令 输出 中 的 PPIDp 栏 给 出 的 是 父 进程 的 进程 ID， 它 是 启动 这 个 进程 的 进程 的 PLD。 如 果 原来 的 
父 进程 已 经 不 存在 ， 该 栏 显示 的 就 是 init 进 程 的 进程 ID 〈(PID 为 1)。 

Linux 调 度 器 根据 进程 的 优先 级 来 决定 运行 哪个 进程 。 每 个 系统 的 具体 实现 各 有 不 同 ， 但 高 优先 
级 的 进程 总 是 运行 得 更 频繁 。 某 些 情况 下 ， 只 要 还 有 高 优先 级 的 进程 可 以 运行 ， 低 优先 级 的 进程 就 根 
本 不 能 运行 。 

11.3 ”启动 新 进程 

我 们 可 以 在 一 个 程序 的 内 部 启动 另 一 个 程序 ， 从 而 创建 一 个 新 进程 。 这 个 工作 可 以 通过 库 函 数 
system 来 完成。 

#include <stdlib.h> 

int system (const char *string); 

system 函 数 的 作用 是 , 运行 以 字符 串 参数 的 形式 传递 给 它 的 命令 并 等 待 该 命令 的 完成 。 命 令 的 执 
行情 况 就 如 同 在 shell 中 执行 如 下 的 命令 ; 

$ sh -c string 
如 果 无 法 启动 shell 来 运行 这 个 命令 ，system 函 数 将 返回 错误 代码 127， 如 果 是 其 他 错误 ， 则 返回 -1， 
否则 ，systen 函 数 将 返回 该 命令 的 退出 码 。 





我 们 用 system 函 数 来 编写 一 个 程序 ,让 它 赫 我 们 运行 ps 命令 .虽然 这 个 程序 本 身 的 用 处 不 是 很 大 ， 
但 我 们 将 在 后 面 的 例子 中 对 这 一 技术 做 进一步 开发 。 为 了 简单 ,我 们 在 这 个 例子 中 也 没有 检查 system 
调用 是 否 能 够 真正 的 工作 。 

#include «stdlib.h» 

#include <stdio.h> 

int main() 


printf ("Running ps with system\n"); 
system("ps ax"); 

printf("Done.Wn*); 

exit(0); 
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编译 并 运行 这 个 程序 sysceml .c 时 ， 将 看 到 如 下 所 示 的 输出 : 


$ ./systeml 
Running ps with system 

PID TTY STAT TIME COMMAND 

1? Ss 0:03 init [5] 

1262 pts/1 ss 0:00 /bin/bash 
1273 pts/2 s 0:00 su - 

1274 pts/2 S+ 0:00 -bash 
1463 pts/2 SN 0:00 oclock 
1465 pts/1 s 0:01 emacs Makefile 
1480 pts/1 S+ 0:00 ./systeml 
1481 pts/1 R+ 0:00 ps ax 
Done. 


因为 system 函 数 用 一 个 shell 来 启动 想 要 执行 的 程序 ， 所 以 可 以 把 这 个 程序 放 到 后 台 执 行 。 具体 做 
法 是 将 systeml .c 中 的 函数 调用 修改 为 下 面 这 样 : 


system(*ps ax &"); 


编译 并 运行 这 个 新 版 本 的 程序 时 ， 我 们 将 看 到 : 
$ ./system2 
Running ps with system 


PID 
1 


Done. 


$ 1274 pts/2 


1463 
1465 
1484 


TTY 


pts/1 
pts/1 
pts/1 


在 第 一 个 例子 中 ， 程 序 以 字符 串 "ps ax" 为 参数 调用 system 函 数 从 而 在 程序 中 执行 ps 命令 。 我 们 
的 程序 在 ps 命令 完成 后 从 system 调 用 中 返回 。system 函 数 很 有 用 ， 但 它 也 有 局 限 性 ， 因 为 程序 必须 
等 待 由 system 函 数 启动 的 进程 结束 之 后 才能 继续 ， 因 此 我 们 不 能 立刻 执行 其 他 任务 。 

在 第 二 个 例子 中 ， 对 system 函 数 的 调用 将 在 shell 命 令 结束 后 立刻 返回 。 由 于 它 是 一 个 在 后 台 运 行 
程序 的 请 求 ， 所 以 ps 程序 一 启动 shell 就 返回 了 ， 这 与 我 们 在 shell 提 示 符 下 执行 下 面 这 条 命令 的 效果 是 


一 样 的 。 


$ ps ax & 
在 ps 命令 还 未 来 得 及 打印 出 它 的 所 有 输出 结果 之 前 ，system2 程 序 就 打印 出 字符 串 pone 然 后 退出 
了 。 在 system2 程 序 退出 后 ，ps 命 令 继续 完成 它 的 输出 。 这 类 的 处 理 行为 往往 会 给 用 户 带 来 很 大 的 困 
感 。 如 果 想 要 用 好 进程 ， 我 们 就 需要 能 够 对 它们 的 行为 做 更 细致 的 控制 。 下 面 来 看 一 个 用 来 创建 进程 
的 底层 接口 exec。 


STAT 


8 


SN 
s 
R 


TIME COMMAND 
0:03 init [5] 


0:00 -bash 
0:00 oclock 
0:01 emacs Makefile 
0:00 ps ax 





一 般 来 说 ， 使 用 system 丁 数 远 非 启动 其 他 进程 的 理想 手段 ， 因 为 它 必 须 用 一 个 shell 来 启 
动 需要 的 程序 。 由 于 在 启动 程序 之 前 需要 先 启动 一 个 shell， 而 且 对 shell 的 安装 情况 及 使 用 的 
环境 的 依赖 也 很 大 ， 所 以 使 用 system 画 数 的 效率 不 高 。 在 下 一 节 中 ， 我们 将 看 到 一 种 更 好 的 
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调用 程序 的 方法 ， 与 system 调 用 相 比 ， 我 们 应 该 总 是 在 程序 中 优先 使 用 这 种 方法 。 


1. 替换 进程 映像 

exec 系 列 函 数 由 一 组 相关 的 函数 组 成 ， 它 们 在 进程 的 启动 方式 和 程序 参数 的 表达 方式 上 各 有 不 
同 。exec 函 数 可 以 把 当前 进程 替换 为 一 个 新 进程 ， 新 进程 由 path 或 tile 参数 指定 。 你 可 以 使 用 exec 
函数 将 程序 的 执行 从 一 个 程序 切换 到 另 一 个 程序 。 例如， 你 可 以 在 启动 另 -个 有 着 受 限 使 用 策略 的 程 
序 前 ,检查 用 户 的 凭证 ,exec 函 数 比 system 函 数 更 有 效 ， 因 为 在 新 的 程序 启动 后 ， 原来 的 程序 就 不 再 
运行 了 。 

#include <unistd.h> 

char **environ; 


int execl(const char *path, const char *arg0, ..., (char *)0); 

int execlp(const char *file, const char *arg0, ..., (char *)0); 

int execle(const char *path, const char *arg0, ..., (char *)0, char *const 
envp(1); 

int execv(const char *path, char *const argv[]); 

int execvp(const char *file, char *const argv[]); 

int execve(const char *path, char *const argv[], char *const envp[]); 


这 些 函 数 可 以 分 为 两 大 类 。exec1、execlp 和 execle 的 参数 个 数 是 可 变 的 ， 参 数 以 一 个 空 指针 结 
束 。execv 和 execvp 的 第 二 个 参数 是 一 个 字符 串 数组 。 不 管 是 哪 种 情况 ， 新 程序 在 启动 时 会 把 在 argv 
数组 中 给 定 的 参数 传递 给 main 函 数 。 

这 些 函 数 通 常 都 是 用 execve 实 现 的， 虽然 并 不 是 必须 要 这 样 做 。 

以 字母 p 结 尾 的 函数 通过 搜索 PATH 环 境 变量 来 查找 新 程序 的 可 执行 文件 的 路 径 。 如 果 可 执行 文件 
不 在 PATH 定 义 的 路 径 中 ， 我 们 就 需要 把 包括 目录 在 内 的 使 用 绝对 路 径 的 文件 名 作为 参数 传递 给 函数 。 

全 局 变量 environ 可 用 来 把 一 个 值 传递 到 新 的 程序 环境 中 。 此 外 ， 函 数 execle 和 execve 可 以 通过 
参数 envp 传 递 字符 串 数组 作为 新 程序 的 环境 变量 。 

如 果 想 通过 exec 函 数 来 启动 ps 程序 ， 我 们 可 以 从 6 个 exec 函 数 中 选择 一 个 ， 如 下 面 的 代码 片段 所 


E 





include <unistd.h> 


/* Example of an argument list */ 
/* Note that we need a program name for argv[0] */ 
Char *const ps argv[] = 

(*ps*, *ax*, 0); 


/* Example environment, not terribly useful */ 
char *const ps envp[] = 
("PATH-/bin:/usr/bin"*, "TERM-console*, 0); 


/* Possible calls to exec functions */ 

execl(*/bin/ps*, + 0); /* assumes ps is in /bin */ 
execlp("ps", *ps", "ax", 0); /* assumes /bin is in PATH */ 
execle(*/bin/ps*, "ps", "ax", 0, ps envp); /* passes own environment */ 





execv(*/bin/ps', ps argv); 
execvp("ps", p: gv); 
execve(*/bin/ps*, ps argv, ps envp); 
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ENI execlp 函 数 


修改 示例 程序 ， 使 用 execlp 函 数 调用 : 





#include «unistd.h» 
#include «stdio.h» 
#include <stdlib.h> 


int main() 

( 
printf ("Running 
execlp(*ps", " 
printf("Done.W 
exit(0); 

) 


运行 这 个 程序 时 ， 你 会 看 到 正常 的 ps 输出 ， 但 字符 串 pone 却 根本 没有 出 现 。 另 外 值得 注意 的 是 ， 
ps 的 输出 中 没有 pexec 进 程 的 任何 信息 。 





$ ./pexec 
Running ps with execlp 
PID TTY STAT TIME COMMAND 
1? s 0:03 init [5] 
1262 pts/1 Ss 0:00 /bin/bash 


1273 pts/2 S su - 





1274 pts/2 s+ -bash 
1463 pts/1 — SN oclock 
1465 pts/1 Ss emacs Makefile 
1514 pts/1 R+ ps ax 


程序 先 打印 出 它 的 第 一 条 消息 ， 接 着 调用 execlp， 这 个 函数 在 PATH 环境 变量 给 出 的 目录 中 搜索 
程序 ps。 然 后 用 这 个 程序 替换 pexec 程 序 ， 就 好 像 直 接 使 用 如 下 所 示 的 shell 命 令 一 样 : 

$ ps ax 

ps 命令 结束 时 ， 我 们 看 到 一 个 新 的 shell 提 示 符 ， 因 为 我 们 并 没有 再 返回 到 pexec 程 序 中 ， 所 以 第 
二 条 消息 是 不 会 打印 出 来 的 。 新 进程 的 PID、PPID 和 nice 值 与 原先 的 完全 一 样 。 事 实 上 ， 这 里 发 生 的 

- 切 其 实 就 是 ， 运 行 中 的 程序 开始 执行 exec 调 用 中 指定 的 新 的 可 执行 文件 中 的 代码 。 

对 于 由 exec 函 数 启动 的 进程 来 说 ， 它 的 参数 表 和 环境 加 在 一 起 的 总 长 度 是 有 限制 的 。 上 限 由 
ARG_MAX 给 出 ， 在 Linux 系 统 上 它 是 128K 字 节 。 其 他 系统 可 能 会 设置 一 个 非常 有 限 的 长 度 ， 这 有 可 能 
会 导致 出 现 问 题 。POSIX 规 范 要 求 ARG_MAX 至 少 要 有 4 096 个 字 节 。 

一 般 情况 下 ，exec 函 数 是 不 会 返回 的 ， 除 非 发 生 了 错误 。 出 现 错误 时 ，exec 函 数 将 返回 -1， 并 
且 会 设置 错误 变量 errno。 

由 exec 启 动 的 新 进程 继承 了 原 进程 的 许多 特性 。 特别 地 , 在原 进程 中 己 打开 的 文件 描述 符 在 新 进 
程 中 仍 将 保持 打开 ， 除 非 它 们 的 “执行 时 关闭 标志 ”(close on exec flag) 被 置 位 〈 详 细 说 明 请 参考 第 3 
章 中 对 fcnt1 系 统 调用 的 介绍 )。 任 何在 原 进 程 中 己 打开 的 目录 流 都 将 在 新 进程 中 被 关闭 。 





2. 复制 进程 映像 
要 想 让 进程 同时 执行 多 个 函数 ， 我 们 可 以 使 用 线程 (将 在 第 12 章 介绍 ) 或 从 原 程序 中 创建 一 个 完 
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全 分 离 的 进程 ， 后 者 就 像 :nit 的 做 法 一 样 ， 而 不 像 exec 调 用 那样 用 新 程序 替换 当前 执行 的 线程 。 
我 们 可 以 通过 调用 fork 创 建 一 个 新 进程 。 这 个 系统 调用 复制 当前 进程 ， 在 进程 表 中 创建 一 个 新 的 

表 项 ， 新 表 项 中 的 许多 属性 与 当前 进程 是 相同 的 。 新 进程 几乎 与 原 进程 一 模 一 样 ， 执 行 的 代码 也 完全 

相同 , 但 新 进程 有 自己 的 数据 空间 、 环 境 和 文件 描述 符 。fork 和 exec 函 数 结合 在 一 起 使 用 就 是 创建 新 

进程 所 需要 的 一 切 了 。 
#include <sys/types.h> z 
#include <unistd.h> 最 初 的 进程 | 
pid t fork(void); 


如 图 11-2 所 示 ， 在 父 进 程 中 的 fork 调 用 返回 的 是 新 的 子 进程 x EN 








的 PID。 新 进程 将 继续 执行 ， 就 像 原 进 程 一 样 ， 不 同 之 处 在 于 ， | 
子 进程 中 的 fork 调 用 返回 的 是 0。 父 子 进程 可 以 通过 这 一 点 来 判 2s 
断 究竟 谁 是 父 进程 ， 谁 是 子 进程 。 返回 一 个 新 的 PID 返回 0 

如 果 fork 失 败 , 它 将 返回 -1。 失 败 通常 是 因为 父 进程 所 拥有 l HU 
的 子 进程 数目 超过 了 规定 的 限制 (cHTLD_MAx)， 此 时 errno 将 被 (ran È > 
设 为 EAGAIN。 如 果 是 因为 进程 表 里 没有 足够 的 空间 用 于 创建 新 的 。 ai NR) 
表单 或 虚拟 内 存 不 足 ，errno 变 量 将 被 设 为 ENOMEM。 E » 

-个 典型 的 使 用 fork 的 代码 片段 如 下 所 示 : 图 112 
pid t new pid; 


new pid = fork(); 


switch(new pid) ( 





case -1 : /* Error */ 
break; 
case 0 : /* We are child */ 
break; 
default : /* We are parent */ 
break; 
) 
一 一 一 一 
* forki& 





我 们 来 看 一 个 简单 的 例子 forkl .c: 


#include <sys/types.h> 
*include <unistd.h> 
#include <stdio.h> 
finclude <stdlib.h> 


int main() 

t 
pid t pid; 
char *message; 
int n; 


printf(*fork program starting\n"); 
pid = fork(); 
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Switch(pid) 
t 


case -1: 


perror('fork failed"); 
exit(1); 


case 0: 


message = "This is the child"; 
nz5; 
break; 


default: 


message = "This is the parent"; 





for(; n» 0; n--) ( 


puts (message) ; 
sleep(1); 


) 
exit(0); 


) 


这 个 程序 以 两 个 进程 的 形式 在 运行 。 子 进程 被 创建 并 且 输 出 消息 5 次 。 原 进程 《 即 父 进程 ) 只 答 


出 消息 3 次 。 父 进程 在 子 进程 打印 





完 它 的 全 部 消息 之 前 就 结束 了 ， 因 此 我 们 将 看 到 在 输出 内 容 中 混杂 


着 一 个 shell 提 示 符 。 
$ ./forki 
fork program starting 


This 
This 
This 
This 
This 
This 


is 
is 
is 
is 
is 
is 


the child 
the parent 
the parent 
the child 
the parent 
the child 


$ This is the child 
This is the child 


实验 解析 


程序 在 调用 fork 时 被 分 为 两 个 独立 的 进程 。 程序 通过 fork 调 用 返回 的 非 零 值 确定 父 进程 ,并 根据 


该 值 来 设置 消息 的 输出 次 数 ， 两 次 消息 的 输出 之 间 间 隔 一 秒 。 


11.3.1 等 待 一 个 进程 
当 用 fork 启 动 一 个 子 进程 时 ， 子 进程 就 有 了 它 自己 的 生命 周期 并 将 独立 运行 。 有 时 ， 我 们 希望 知 





结束 。 
#include «sys/types.h» 
#include <sys/wait.h> 


子 进程 何 时 结束 。 例 如 ， 在 前 面 的 示例 程序 中 ， 父 进程 在 子 进程 之 前 结束 ， 由 于 子 进程 还 在 继 
， 所 以 得 到 的 输出 结果 有 点 乱 。 我 们 可 以 通过 在 父 进程 中 调用 wait 函 数 让 父 进程 等 待 子 进程 的 


pid t wait(int *stat loc); 
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wait 系 统 调用 将 暂停 父 进程 直到 它 的 子 进程 结束 为 止 。 这 个 调用 返回 子 进程 的 PTD， 它 通常 是 已 
经 结束 运行 的 子 进程 的 PID。 状 态 信息 允许 父 进程 了 解 子 进程 的 退出 状态 ， 即 子 进程 的 main 函 数 返回 








的 值 或 子 进程 中 exit 函 数 的 退出 码 。 如 果 stat_1oc 不 是 空 指针 ， 状 态 信息 将 被 写 入 它 所 指向 的 位 置 。 
我 们 可 以 用 sys/wait .h 文 件 中 定义 的 宏 来 解释 状态 信息 ， 如 表 11-2 所 示 。 
表 11-2 
E 说 明 

WIFEXITED(stat val) 如 果子 进程 正常 结束 ， 它 就 取 一 个 非 零 值 

WEXITSTATUS (stat_val) 如 果 wTFEXITED 非 零 ， 它 返回 子 进程 的 退出 码 

WIFSIGNALED (stat. val) 如 果子 进程 因为 一 个 未 捕获 的 信号 而 终止 ， 它 就 取 一 个 非 零 值 
WTERMSIG(stat val) 如 果 wIFsIGNALED 非 零 ， 它 返回 一 个 信号 代码 

WIFSTOPPED (stat. val) 如 果子 进程 意外 终止 ， 它 就 取 一 个 非 零 值 

WSTOPSIG(stat val) 如 果 wTFSTOPPED 非 零 ， 它 返回 一 个 信号 代码 


下 5 0 585 
EUM weit 函数 


我 们 稍微 修改 一 下 程序 ， 让 父 进程 等 待 并 检查 子 进程 的 退出 状态 。 新 程序 被 命名 为 wait .c: 
#include <sys/types.h> 
#include «sys/wait.h» 


* 


include «unistd.h» 


#include «stdio.h» 
#include <stdlib.h> 


int main() 


t 


pid t pid; 
Char *message; 
int n; 

int exit code; 


printf(*fork program startingWn*); 
pid = fork); 

switchipid) 

( 


case -1: 
perror ("fork failed"); 
exit(1); 

case 0: 
message = "This is the child"; 


default: 
message = "This is the parent"; 
n-23; 
exit code - 0; 
break; 
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forl; n > 0; n--) ( 
puts (message) ; 
sleepi1); 

) 


程序 的 这 一 部 分 等 待 子 进程 完成 : 


if (pid !- 0) ( 
int stat val; 
pid t child pid; 


child pid = wait(&stat val]; 


printf('Child has finished: PID = $dWn*, child pid); 
if(WIFEXITED(stat. val)) 
printf(*Child exited with code %d\n", WEXITSTATUS (stat val)); 
else 
printf(*Child terminated abnormally Wn"); 
) 
exit(exit code); 
) 


运行 这 个 程序 时 ， 我 们 将 看 到 父 进程 等 待 子 进程 的 情况 
$ ./wait 

fork program starting 

This is the child 

This is the parent 

This is the parent 

This is the child 

This is the parent 

This is the child 

This is the child 

This is the child 

Child has finished: PID - 1582 
Child exited with code 37 

$ 


父 进程 (从 fork 调 用 中 获得 一 个 非 零 的 返回 值 ) 用 wait 系 统 调用 将 自己 的 执行 挂 起 ， 直 到 子 进程 
的 状态 信息 出 现 为 止 。 这 将 发 生 在 子 进程 调用 exit 的 时 候 。 我 们 将 子 进程 的 退出 码 设置 为 37。 父 进程 
然后 继续 运行 ， 通 过 测试 wait 调 用 的 返回 值 来 判断 子 进程 是 否 正常 终止 。 如 果 是 ， 就 从 状态 信息 中 提 
取出 子 进程 的 退出 码 。 








11.82 ”僵尸 进程 

用 fork 来 创建 进程 确实 很 有 用 ， 但 你 必须 清楚 子 进程 的 运行 情况 。 子 进程 终止 时 ， 它 与 父 进程 之 
间 的 关联 还 会 保持 ， 直 到 父 进程 也 正常 终止 或 父 进程 调用 wait 才 告 结束 。 因 此 ， 进 程 表 中 代表 子 进程 
的 表 项 不 会 立刻 释放 。 虽 然 子 进程 已 经 不 再 运行 ， 但 它 仍然 存在 于 系统 中 ， 因 为 它 的 退出 码 还 需要 
保存 起 来 ， 以 备 父 进程 今后 的 wait 调 用 使 用 。 这 时 它 将 成 为 一 个 死 defunct) 进程 或 僵尸 (zombie) 
进程 。 

如 果 修改 Forkx 示 例 程序 中 的 消息 输出 次 数 ,我 们 就 能 看 到 僵尸 进程 。 如 果子 进程 输出 消息 的 次 数 
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少 于 父 进程 ， 它 就 会 率先 结束 并 成 为 僵尸 进程 直到 父 进程 也 结束 。 





fork2.c 和 fork1.c 基 本 一 样 ， 只 是 父 、 子 进程 输出 消息 的 次 数 对 调 了 一 下 。 下 面 是 相关 的 代 
码 行 : 


switch(pid) 

t 

case -1: 
perror("fork failed"); 
exit(1); 

case 0: 
message = "This is the child'; 
nz3 
break; 

default: 
message - "This is the parent'; 
n=5; 
break; 

} 


实验 解析 
如 果 用 ./fork2 5 命令 了 上 面 这 个 程序 , 然后 在 子 进程 结束 之 后 父 进程 结束 之 前 调用 ps 程序 ， 
我 们 将 会 看 到 如 下 阴影 显示 的 一 行 〈 一 些 系统 可 能 使 用 <zombie> 而 不 是 <aefunct>)。 








$ ps -al 
F S UID PID PPID C PRI NI ADDR SZ WCHAN TTY TIME CMD 
004 S 0 1273 1259 0 75 0- 589 waité pts/2 00:00:00 su 
000 S 0 1274 1273 0 75 0 - 731 schedu pts/2 00:00:00 bash 
000 S 500 1463 1262 0 75 0- 788 schedu pts/1 00:00:00 oclock 
000 S 500 1465 1262 0 75 0 - 2569 schedu pts/1 00:00:01 emacs 
000 S 500 1603 1262 0 75 0- 313 schedu pts/1 00:00:00 fork2 
003 Z 500 1604 1600 0 75 0- 0 do exi pts/1 00: fork2 «defunct» 
000 R 500 1605 1262 0 81 0- 781- pts/1 00:00:00 ps 


如 果 此 时 父 进程 异常 终止 ， 子 进程 将 自动 把 PID 为 1 的 进程 《 即 init) 作为 自己 的 父 进程 。 子 进程 
现在 是 一 个 不 再 运行 的 僵尸 进程 ， 但 因为 其 父 进程 异常 终止 ， 所 以 它 由 init 进 程 接管 。 僵 尸 进程 将 一 
直 保 留 在 进程 表 中 直到 被 init 进 程 发 现 并 释放 。 进 程 表 越 大 ， 这 一 过 程 就 越 慢 。 应 该 尽量 避免 产生 便 
尸 进程 ， 因 为 在 init 清 理 它们 之 前 ， 它 们 将 一 直 消 耗 系统 的 资源 。 

还 有 另 一 个 系统 调用 可 用 来 等 待 子 进程 的 结束 ， 它 是 waitpia 函 数 。 你 可 以 用 它 来 等 待 某 个 特定 
进程 的 结束 。 

#include <sys/types.h> 

#include <sys/wait.h> 

pid t waitpid(pid t pid, int *stat loc, int options); 

pid 参 数 指定 需要 等 待 的 子 进程 的 PID。 如 果 它 的 值 为 -1，waitpia 将 返回 任 一 子 进程 的 信息 。 与 
wait 一 样 ， 如 果 stat_loc 不 是 空 指针 ，waitpia 将 把 状态 信息 写 到 它 所 指向 的 位 置 。option 参 数 可 
用 来 改变 waitpia 的 行为 , 其 中 最 有 用 的 一 个 选项 是 wNOHANG, 它 的 作用 是 防止 waitpia 调 用 将 调用 者 
的 执行 挂 起 。 你 可 以 用 这 个 选项 来 查找 是 否 有 子 进程 已 经 结束 ， 如 果 没有 ， 程 序 将 继续 执行 。 其 他 的 
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选项 和 wait 调 用 的 选项 相同 。 

因此 , 如 果 想 让 父 进程 周期 性 地 检查 某 个 特定 的 子 进程 是 否 已 终止 , 就 可 以 使 用 如 下 的 调用 方式 : 

waitpid(child pid, (int *) 0, WNOHANG); 

如 果子 进程 没有 结束 或 意外 终止 ， 它 就 返回 0， 否 则 返回 chila_pia。 如 果 waitpid 失 败 ， 它 将 返 
回 -1 并 设置 errno。 失 败 的 情况 包括 :没有 子 进程 (errno 设 置 为 cHILD)、 调 用 被 某 个 信号 中 断 (EINTR》 
或 选项 参数 无 效 (EINVAL)。 


11.3.3 ”输入 和 输出 重 定向 


己 打开 的 文件 描述 符 将 在 Fork 和 exec 调 用 之 后 保留 下 来 , 我 们 可 以 利用 对 进程 这 方面 知识 的 理解 
玉 改 变 程序 的 行为 。 下 一 个 例子 涉及 一 个 过 渡 程 序 : 它 从 标准 输入 读 取 数据 ,然后 向 标准 输出 写 数据 ， 
同时 在 输入 和 输出 之 间 对 数据 做 一 些 有 用 的 转换 。 
实验 | 重 定向 

下 面 是 一 个 非常 简单 的 过 滤 程 序 upper .c， 它 读 取 输入 并 将 输入 字符 转换 为 大 写 : 

#include <stdio.h> 


#include <ctype.h> 
#include «stdlib.h» 





int main() 
( 

int ch; 

while((ch = getchar()) != EOF) ( 

putchar (toupper (ch] ) ; 

) 

exit(0); 
) 
运行 这 个 程序 时 ， 它 按照 我 们 预期 的 那样 执行 ， 如 下 所 示 : 
$ ./upper 
hello THERE 
HELLO THERE 
^D 
$ 
当然 还 可 以 利用 shell 的 重 定向 把 一 个 文件 的 内 容 全 部 转换 为 大 写 ， 如 下 所 示 : 
$ cat file.txt 
this is the file, file.txt, it is all lower case. 
$ ./upper < file.txt 
THIS IS THE FILE, FILE.TXT, IT IS ALL LOWER CASE. 


如 果 我 们 想 在 另 一 个 程序 中 使 用 这 个 过 滤 程 序 会 发 生 什 么 情况 呢 ? 下 面 这 个 程序 useupper.c 接 
受 一 个 文件 名 作为 命令 行 参数 ， 如 果 对 它 的 调用 不 正确 ， 它 将 响应 一 个 错误 信息 。 
#include <unistd.h> 


#include <stdio.h> 
#include <stdlib.h> 


int main(int argc, char *argv[]) 
t 
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char *filename; 

if (argc != 2) ( 
fprintf(stderr, "usage: useupper fileWn*); 
exit(1); 

t 


filename = argv(1]; 
重新 打开 标准 输入 ， 并 再 次 检查 有 无 错误 发 生 ， 然 后 用 exec1 调 用 upper 程 序 ; 


if(!freopen(filename, "r", stdin)) ( 
fprintf(stderr, "could not redirect stdin from file s\n", filename); 
exit(2); 

) 


execl(*./upper*, *upper*, 0); 
不 要 忘记 exec1 会 奉 换 掉 当 前 的 进程 。 如 果 没 有 发 生 错 误 ， 剩 下 的 这 些 语句 将 不 会 被 执行 ， 


perror(*could not exec ./upper*); 
exit(3); 
) 


个 程序 时 ， 我 们 可 以 提供 给 它 一 个 文件 ， 让 它 把 该 文件 的 内 容 全 部 转换 为 大 写 。 这 项 工作 
由 程序 uppe; 但 它 并 不 处 理 文件 名 参数 。 注 意 ， 我 们 并 不 需要 upper 程 序 的 源 代码 。 我 们 可 以 
利用 这 种 方 了 任何 可 执行 程序 : 

$ ./useupper file.txt 

THIS IS THE FILE, FILE.TXT, IT IS ALL LOWER CASE. 


useupper 程 序 用 freopen 函 数 先 关闭 标准 输入 ， 然 后 将 文件 流 stain 与 程序 参数 给 定 的 文件 名 关 
联 起 来 。 接 下 来 ， 它 调用 exec1 用 upper 程 序 替换 掉 正 的 进程 代码 。 因 为 已 打开 的 文件 描述 符 会 
在 exec1 调 用 之 后 保留 下 来 ， 所 以 upper 程 序 的 运行 情况 和 它 在 shell 提 示 符 下 的 运行 情况 完全 一 样 ; 

$ ./upper < file.txt 

















11.3.4 ”线程 


Linux 系 统 中 的 进程 可 以 互相 协作 、 互 相 发 送 消息 、 互 相 中 断 ， 甚 至 可 以 共享 内 存 段 。 但 从 本 质 
上 来 说 ， 它 们 是 操作 系统 内 各 自 独立 的 实体 ， 要 想 在 它们 之 间 共享 变量 并 不 是 很 容易 。 

在 许多 UNIX 和 Linux 系 统 中 都 有 一 类 进程 叫做 线程 (thread)。 涉 及 线程 的 编程 是 比较 困难 的 ， 但 
它 在 某 些 应 用 软件 (如 多 线程 数据 库 服务 器 中 又 有 很 大 的 用 处 。 在 Linux (或 UNIX) 系统 中 编写 线 
程 程序 并 不 像 编写 多 进程 程序 那么 常见 ， 因 为 Linux 中 的 进程 都 是 非常 轻 量 级 的 ， 而 且 编 写 多 个 互相 
协作 的 进程 比 编写 线程 要 容易 得 多 。 我 们 将 在 第 12 章 介绍 线程 。 


114 信和 号 


信号 是 UNIX 和 Linux 系 统 响应 某 些 条 件 而 产生 的 一 个 事件 。 接 收 到 该 信号 的 进程 会 相应 地 采取 一 
些 行动 。 我 们 用 术语 生成 raise) 表示 一 个 信号 的 产生 ， 使 用 术语 捕获 catch) 表示 接收 到 一 个 信号 。 


114 信号 405 





信号 是 由 于 某 些 错误 条 件 而 生成 的 ， 如 内 存 段 冲突 、 浮 点 处 理 器 错误 或 非法 指令 等 。 它 们 由 shell 和 终 
端 处 理 器 生成 来 引起 中 断 ， 它 们 还 可 以 作为 在 进程 间 传 递 消息 或 修改 行为 的 一 种 方式 ， 明 确 地 由 一 个 
进程 发 送 给 另 一 个 进程 。 无 论 何 种 情况 ， 它 们 的 编程 接口 都 是 相同 的 。 信 号 可 以 被 生成 、 捕 获 、 响 应 
或 《至 少 对 于 一 ) 忽略 。 

信号 的 名 称 是 在 头 文件 signal .h 中 定义 的 。 它 们 以 srG 开 头 ， 见 表 11-3。 




















X 11-3 
信号 名 称 说 了 明 
SIGABORT * 进 程 异常 终止 
SIGALRM 超时 警告 
SIGFPE * 浮 点 运算 异常 
SIGHUP 连接 挂 断 
SIGILL * 非 法 指令 
SIGINT 终端 中 断 
SIGKILL 终止 进程 〈 此 信号 不 能 被 捕获 或 忽略 ) 
SIGPIPE 向 无 读 进程 的 管道 写 数据 
SIGQUIT 终端 退出 
8TGSEGV * 无 效 内 存 段 访问 
SIGTERM 
SIGUSRI 
SIGUSR2 
* 系统 对 信号 的 响应 视 具体 实现 而 定 . 


如 果 进 程 接收 到 这 些 信号 中 的 一 个 ， 但 事先 没有 安排 捕获 它 ， 进 程 将 会 立刻 终 
生成 核心 转 储 文件 core， 并 将 其 放 在 当前 目录 下 。 该 文件 是 进程 在 内 存 中 的 映像 ， 





通常 ， 系 统 将 
它 对 程序 的 调试 很 











有 用 处 。 
其 他 信号 见 表 11-4。 
表 11-4 
信号 名 称 说 m 
SIGCHLD 子 进程 已 经 停止 或 退出 
SIGCONT 继续 执行 暂停 进程 
SIGSTOP 停止 执行 《此 信号 不 能 被 捕获 或 忽略 ) 
SIGTSTP 终端 挂 起 
SIGTTIN 后 台 进程 尝试 读 操作 
SIGTTOU 后 台 进程 尝试 写 操作 


SIGCHLD 信 号 对 于 管理 子 进程 很 有 用 。 默 认 情 况 下 ， 它 是 被 忽略 的 。 其 余 的 信号 会 使 接收 它们 的 
进程 停止 运行 ， 但 sTGcoNT 是 个 例外 ， 它 的 作用 是 让 进程 恢复 并 继续 执行 。shell 脚 本 通过 它 来 控制 作 
业 ， 但 用 户 程序 很 少 会 用 到 它 。 

稍 后 我 们 将 对 表 11-3 中 的 信号 做 进一步 的 介绍 。 现 在 ， 我 们 只 需 知道 如 果 shell 和 终端 驱动 程序 是 
按 通 常情 况 配 置 的 话 ， 在 键盘 上 敲 入 中 断 字符 通常 是 Ctrl+C 组 合 键 ) 就 会 向 前 台 进 程 ( 即 当前 正在 
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运行 的 程序 ) 发 送 STGINT 信 号 ， 这 将 引起 该 程序 的 终止 ， 除 非 它 事先 安排 了 捕获 这 个 信号 。 

如 果 想 发 送 一 个 信号 给 进程 ， 而 该 进程 并 不 是 当前 的 前 台 进程 ， 就 需要 使 用 kil1 命 令 。 该 命令 需 
要 有 一 个 可 选 的 信号 代码 或 信号 名 称 和 一 个 接收 信号 的 目标 进程 的 PID〈 这 个 PID 一 般 需 要 用 ps 命令 查 
出 来 )。 例如 ， 如 果 要 向 运行 在 另 一 个 终端 上 的 PID 为 512 的 进程 发 送 “ 挂 断 ” 信 号， 可 以 使 用 如 下 命令 ; 

$ kill -HUP 512 

xil1 命 令 有 一 个 有 用 的 变 体 叫 xillal1， 它 可 以 给 运行 着 某 一 命令 的 所 有 进程 发 送信 号 。 并 不 是 
所 有 的 UNIX 系 统 都 支持 它 ， 但 Linux 系 统一 般 都 有 该 命令 。 如 果 不 知 道 某 个 进程 的 PID， 或 者 想 给 执 
行 相同 命令 的 许多 不 同 的 进程 发 送信 号 ， 这 条 命令 就 很 有 用 了 。 一 种 常见 的 用 法 是 ， 通 知 ineta 程 序 
重新 读 取 它 的 配置 选项 ， 要 完成 这 一 工作 ， 可 以 使 用 下 面 这 条 命令 : 

$ killall -HUP inetd 

程序 可 以 用 signal 库 函数 来 处 理 信号 ， 它 的 定义 如 下 所 示 : 

#include «signal.h» 





void (*signal(int sig, void (*func) (int))) (int); 
这 个 相当 复杂 的 函数 定义 说 明 ，signal 是 一 个 带 有 sig 和 func 两 个 参数 的 函数 。 准 备 捕获 或 忽略 
的 信号 由 参数 sig 给 出 ， 接 收 到 指定 的 信号 后 将 要 调用 的 函数 由 参数 func 给 出 。 信 号 处 理 函数 必须 有 
-个 int 类 型 的 参数 〈 即 接收 到 的 信号 代码 并且 返 回 类 型 为 voiG。signal 函 数 本 身 也 返回 一 个 同类 
型 的 函数 ， 即 先前 用 来 处 理 这 个 信号 的 函数 ， 或 者 也 可 以 用 表 11-5 中 的 两 个 特殊 值 之 一 来 代替 信号 处 
理 函 数 。 
表 11-5 
SIG_IGN 忽略 信号 
SIG_DFL 恢复 默认 行为 
通过 一 个 实例 可 以 更 清楚 地 理解 信号 的 处 理 方法 。 下 面 我 们 来 编写 一 个 
用 户 敲 入 的 CtrltC 组 合 键 ， 在 屏幕 上 打印 一 条 适当 的 消息 而 不 是 终止 程序 的 
CtrltC 时 ， 程 序 将 结束 运行 。 


实验 信号 处 理 
函数 ouch 对 通过 参数 sig 传 递 进来 的 信号 作出 响应 。 信 号 出 现时 ， 程 序 调用 该 函数 ， 它 先 打印 一 
条 消息 , 然后 将 信号 sTGINT (默认 情况 下 , 按 下 Ctrl+C 将 产生 这 个 信号 ) 的 处 理 方式 恢复 为 默认 行为 。 


finclude «signal.h» 
include <stdio.h> 
#include <unistd.h> 








这 ctrlc.c， 它 将 响应 
当 用 户 第 二 次 按 下 








void ouch(int sig) 
t 
printf(*OUCH! - I got signal %d\n*, sig); 
(void) signal(SIGINT, SIG DFL); 
} 


main 函 数 的 作用 是 ,截获 按 下 Ctrit+C 组 合 键 时 产生 的 sIGINT 信 号 。 没 有 信号 出 现时 ， 它 会 在 一 个 
无 限 循环 中 每 隔 一 秒 打印 一 条 消息 。 
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int main() 
t 
(void) signal(SIGINT, ouch); 


while(1) ( 
printf('Hello World!in*); 
sleep(1); 
) 
} 
第 一 次 按 下 Ctrl+C 组 合 键 会 让 程序 作出 响应 ， 然 后 程序 继续 执行 。 再 次 按 下 Ctrl+C 组 合 键 时 ， 程 
序 将 结束 运行 ， 因 为 SIGINT 信 号 的 处 理 方式 已 恢复 为 默认 行为 一 一 终止 程序 的 运行 。 
$ ./ctrlcl 
Hello World! 
Hello World! 
Hello World! 
Hello World! 
ac 
OUCH! - I got signal 2 
Hello World! 
Hello World! 
Hello World! 
Hello World! 
ac 
$ 
在 此 例 中 我 们 可 以 看 到 ， 信 号 处 理 函 数 使 用 了 一 个 单独 的 整数 参数 ， 它 就 是 引起 该 函数 被 调用 的 
信号 代码 。 如果 需要 在 同一 个 函数 中 处 理 多 个 信号 , 这 个 参数 就 很 有 用 。 在 本 例 中 , 我 们 打印 出 SIGINT 
的 值 ， 它 的 值 在 这 个 系统 中 恰好 是 2， 但 你 不 能 过 分 依赖 传统 的 信号 数字 值 ， 而 应 该 在 新 的 程序 中 总 
是 使 用 信号 的 名 字 。 
在 信号 处 理 函 数 中 ， 调 用 如 printf 这 样 的 函数 是 不 安全 的 .一 个 有 用 的 技巧 是 ， 在 信号 
处 理 函 数 中 设置 一 个 标志 ， 然 后 在 主 程序 中 检查 该 标志 ， 如 需要 就 打印 一 条 消息 。 在 本 章 的 
结尾 部 分 ， 你 将 会 看 到 一 个 函数 列表 ， 表 中 的 函数 都 可 以 在 信号 处 理 函 数 中 被 安全 地 调用 。 


程序 中 安排 函数 cuch 来 处 理 在 按 下 Ctrl+C 组 合 键 时 所 产生 的 sTGINT 信 号 。 程 序 会 在 中 断 函数 ouch 
处 理 完毕 后 继续 执行 ， 但 信号 处 理 方式 已 恢复 为 默认 行为 《不 同 版 本 的 UNIX 系 统 ， 特 别 是 从 Berkley 
UNIX 衍 生出 来 的 那些 版 本 ， 在 对 信号 的 处 理 方式 上 从 历史 上 就 有 些 细微 的 不 同 。 如 果 想 让 信号 的 处 
理 方式 在 信号 发 生 后 恢复 到 其 默认 行为 ， 最 好 的 方法 就 是 自己 写 出 具体 的 信号 处 理 代码 )。 当 它 接收 
到 第 二 个 SIGINT 信号 后 ， 程 序 将 采取 默认 的 行动 ， 即 终止 程序 的 运行 。 

如 果 想 保留 信号 处 理 函 数 ， 让 它 继续 响应 用 户 的 Ctrl+C 组 合 键 ， 我 们 就 需要 再 次 调用 signal 函 数 
来 重新 建立 它 。 这 会 使 信号 在 一 段 时 间 内 无 法 得 到 处 理 ， 这 段 时 间 从 调用 中 断 函 数 开始 ， 到 信号 处 理 
函数 的 重建 为 止 。 如 果 在 这 段 时 间 内 程序 接收 到 第 二 个 信号 , 它 就 会 违背 我 们 的 意愿 终止 程序 的 运行 。 

我 们 不 推荐 大 家 使 用 signal 接 口 . 之 所 以 会 在 这 里 介绍 它 , 是 因为 你 可 能 会 在 许多 老 程 
序 中 看 到 它 的 应 用 。 稍 后 我 们 会 介绍 一 个 定义 更 清晰 、 执 行 更 可 靠 的 函数 sigaction， 在 所 
有 的 新 程序 中 都 应 该 使 用 这 个 函数 。 
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signal 函 数 返回 的 是 先前 对 指定 信号 进行 处 理 的 信号 处 理 函数 的 函数 指针 , 如 果 未 定义 信号 处 理 
函数 ， 则 返回 sIG_ERR 并 设置 errno 为 一 个 正 数值 。 如 果 给 出 的 是 一 个 无 效 的 信号 ， 或 者 尝试 处 理 的 
信号 是 不 可 捕获 或 不 可 忽略 的 信号 (如 sIGKILL)，errno 将 被 设置 为 EINVAL。 





11.4.1 ”发 送信 号 


进程 可 以 通过 调用 xil1 函 数 向 包括 它 本 身 在 内 的 其 他 进程 发 送 一 个 信号 。 如果 程 序 没有 发 送 该 信 
号 的 权限 ， 对 kil1 函 数 的 调用 就 将 失败 ， 失 败 的 常见 原因 是 目标 进程 由 另 一 个 用 户 所 拥有 。 这 个 函数 
和 同名 的 shell 命 令 完成 相同 的 功能 ， 它 的 定义 如 下 所 示 : 

#include <sys/types.h> 

include <signal.h> 


int kill(pid t pid, int sig); 

kil1 函 数 把 参数 sig 给 定 的 信号 发 送 给 由 参数 pia 给 出 的 进程 号 所 指定 的 进程 ， 成 功 时 它 返回 0。 
要 想 发 送 一 个 信号 , 发 送 进程 必须 拥有 相应 的 权限 。 这 通常 意味 着 两 个 进程 必须 拥有 相同 的 用 户 ID( 即 
你 只 能 发 送信 号 给 属于 自己 的 进程 ， 但 超级 用 户 可 以 发 送信 号 给 任何 进程 )。 

kil1 调 用 会 在 失败 时 返回 -1 并 设置 errno 变 量 。 失 败 的 原因 可 能 是 : 给 定 的 信号 无 效 (errno 设 
WOUEINVAL) 发 送 进程 权限 不 够 errno 设 置 为 EpERM)， 目 标 进程 不 存在 〈errno 设 置 为 EsRCH)。 

信和 号 向 我 们 提供 了 一 个 有 用 的 闹钟 功能 。 进 程 可 以 通过 调用 alarm 函 数 在 经 过 预定 时 间 后 发 送 一 
个 SIGALRM 信 号 。 

#include <unistd.h> 








unsigned int alarm(unsigned int seconds); 

alarm 函 数 用 来 在 seconds 秒 之 后 安排 发 送 一 个 SIGALRM 信 号 。 但 由 于 处 理 的 延 时 和 时 间 调度 的 不 
确定 性 ， 实 际 益 钟 时 间 将 比 预先 安排 的 要 稍微 拖 后 一 点 儿 。 把 参数 seconas 设 置 为 0 将 取消 所 有 已 设置 
的 竟 钟 请 求 。 如 果 在 接收 到 sIGALRM 信 号 之 前 再 次 调用 alarm 函 数 ， 则 闹钟 重新 开始 计时 。 每 个 进程 只 
能 有 一 个 闹钟 时 间 。alarm 函 数 的 返回 值 是 以 前 设置 的 闹钟 时 间 的 余 留 秒 数 ， 如 果 调 用 失败 则 返回 -1。 

为 了 说 明 alarm 函 数 的 工作 情况 ， 我 们 通过 使 用 fork、sleep 和 signal 来 模拟 它 的 效果 。 程 序 可 
以 启动 一 个 新 的 进程 ， 它 专门 用 于 在 未 来 的 某 一 时 刻 发 送 一 个 信号 。 





alarm.c 程 序 里 的 第 一 个 函数 aing 的 作用 是 模拟 一 个 闹钟 。 


#include «sys/types.h» 
#include «signal.h» 
#include <stdio.h> 
#include <unistd.h> 
#include <stdlib.h> 


static int alarm_fired = 0; 


void ding(int sig) 
t 
alarm_fired = 1; 


) 
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在 main 函 数 中 ， 我 们 告诉 子 进程 在 等 待 5 秒 后 发 送 一 个 SIGALRM 信 号 给 它 的 父 进程 。 


int main() 
t 
pid t pid; 
printf(*alarm application starting in"); 


pid - fork(); 
switch(pid) ( 
case -1: 
/* Failure */ 
perror ("fork failed"); 
exit(1); 
case 0: 
/* child */ 
sleep(5); 
kill(getppid(), SIGALRM); 
exit(0); 
) 


父 进程 通过 一 个 signal 调 用 安排 好 捕获 STGALRM 信 号 的 工作 ， 然 后 等 待 它 的 到 来 。 
/* if we get here we are the parent process */ 
printf(*waiting for alarm to go offin*); 
(void) signallSIGALRM, ding); 
pause() ; 
if (alarm fired) 
printf(*Ding!W*); 


printf(*doneWn") ; 


exit(0); 
} 
运行 这 个 程序 时 ， 它 会 暂停 5 秒 ， 等 待 模拟 闵 钟 的 闹 响 。 
$ ./alarm 


alarm application starting 
waiting for alarm to go off 
«5 second pause» 

Ding! 

done 


$ 

这 个 程序 用 到 了 一 个 新 的 函数 pause， 它 的 作用 很 简单 ， 就 是 把 程序 的 执行 挂 起 直到 有 一 个 信号 
出 现 为 止 。 当 程序 接收 到 一 个 信号 时 , 预 设 好 的 信号 处 理 函数 将 开始 运行 ,程序 也 将 恢复 正常 的 执行 。 
pause 函 数 的 定义 如 下 所 示 : 

#include «unistd.h» 


int pause(void); 
当 它 被 一 个 信号 中 断 时 ， 将 返回 -1〈 如 果 下 一 个 接收 到 的 信号 没有 导致 程序 终止 的 话 ) 并 把 errno 设 
置 为 ETNTR。 当 需要 等 待 信号 时 ， 一 个 更 常见 的 方法 是 使 用 稍 后 将 要 介绍 的 sigsuspend 函 数 。 
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闹钟 模拟 程序 通过 fork 调 用 启动 新 的 进程 。 这 个 子 进程 休眠 5 秒 后 向 其 父 进程 发 送 一 个 SIGALRM 
信号 。 父 进程 在 安排 好 捕获 SIGALRM 信 号 后 暂停 运行 ， 直 到 接收 到 一 个 信号 为 止 。 我 们 并 未 在 信号 处 
理 函数 中 直接 调用 printf， 而 是 通过 在 该 函数 中 设置 标志 ， 然 后 在 main 函 数 中 检查 该 标志 来 完成 消 
息 的 输出 。 

使 用 信号 并 挂 起 程序 的 执行 是 Linux 程 序 设计 中 的 一 个 重要 部 分 。 这 意味 着 程序 不 需要 总 是 在 执 
行 着 。 程 序 不 必 在 一 个 循环 中 无 休止 地 检查 某 个 事件 是 否 已 发 生 ， 相 反 ， 它 可 以 等 待 事件 的 发 生 。 这 
在 只 有 一 个 CPU 的 多 用 户 环境 中 尤其 重要 ， 进 程 共 享 着 一 个 处 理 器 ， 繁 忙 的 等 待 将 会 对 系统 的 性 能 造 
成 极 大 的 影响 。 程 序 中 信号 的 使 用 将 带 来 一 个 特殊 的 问题 :“ 如 果 信号 出 现在 系统 调用 的 执行 过 程 中 
会 发 生 什么 情况 ? ”答案 是 相当 让 人 不 满意 的 “ 视 情况 而 定 "。 一 般 来 说 ， 你 只 需要 考虑 慢 系统 调用 ， 
例如 从 终端 读数 据 ， 如 果 在 这 个 系统 调用 等 待 数据 时 出 现 一 个 信号 ， 它 就 会 返回 一 个 错误 。 如 果 你 开 
始 在 自己 的 程序 中 使 用 信号 ， 就 需要 注意 一 些 系统 调用 会 因为 接收 到 了 一 个 信号 而 失败 ， 而 这 种 错误 
情况 可 能 是 你 在 添加 信号 处 理 函 数 之 前 没有 考虑 到 的 。 

在 编写 程序 中 处 理 信号 部 分 的 代码 时 必须 非常 小 心 ， 因 为 在 使 用 信号 的 程序 中 会 出 现 各 种 各 样 的 
“HERE”. 例如， 如 果 想 调用 pause 等 待 一 个 信号 ， 可 信号 却 出 现在 调用 pause 之 前 ， 就 会 使 程序 
无 限期 地 等 待 一 个 不 会 发 生 的 事件 。 这 些 况 态 条 件 都 是 一 些 对 时 间 要 求 很 苛刻 的 问题 ， 许 多 编程 新 手 














一 个 健壮 的 信号 接口 

我 们 已 经 对 用 signal 和 其 相关 函数 来 生成 和 捕获 信号 做 了 比较 深入 的 介绍 ， 因 为 它们 在 传统 的 
UNIX 编 程 中 很 常见 。 但 X/Open 和 UNIX 规 范 推荐 了 一 个 更 新 和 更 健壮 的 信号 编程 接口 ，sigaction。 
它 的 定义 如 下 所 示 : 

#include «signal.h» 


int sigaction(int sig, const struct sigaction *act, struct sigaction *oact); 
sigaction 结 构 定义 在 文件 signal .h 中 ， 它 的 作用 是 定义 在 接收 到 参数 sig 指 定 的 信号 后 应 该 采 
取 的 行动 。 该 结构 至 少 应 该 包括 以 下 几 个 成 员 : 


void (*) (int) sa_handler /* function, SIG DFL or SIG IGN 
sigset t sa mask /* signals to block in sa handler 
int sa flags /* signal action modifiers 


sigaction 函 数 设置 与 信号 sig 关 联 的 动作 。 如 果 oact 不 是 空 指针 ，sigaction 将 把 原先 对 该 信 
号 的 动作 写 到 它 指向 的 位 置 。 如 果 act 是 空 指针 ， 则 sigaction 函 数 就 不 需要 再 做 其 他 设置 了 ， 否 则 
将 在 该 参数 中 设置 对 指定 信号 的 动作 。 

与 signal 函 数 一 样 ，sigaction 函 数 会 在 成 功 时 返回 9，， 失 败 时 返回 -1。 如 果 给 出 的 信号 无 效 或 
者 试图 对 一 个 不 允许 被 捕获 或 忽略 的 信号 进行 捕获 或 忽略 ， 错 误 变量 errno 将 被 设置 为 EINVAL。 

在 参数 act 指 向 的 sigact ion 结 构 中 ，sa_handler 是 一 个 函数 指针 ， 它 指向 接收 到 信号 sig 时 将 
被 调用 的 信号 处 理 函数 。 它 相当 于 前 面 见 到 的 传递 给 函数 signal 的 参数 func。 我 们 可 以 将 sa_handler 
字段 设置 为 特殊 值 sIG_IGN 和 sIG_DFL， 它 们 分 别 表示 信号 将 被 忽略 或 把 对 该 信号 的 处 理 方式 恢复 为 
默认 动作 。 

sa_mask 成 员 指定 了 一 个 信号 集 ， 在 调用 sa_hanaler 所 指向 的 信号 处 理 函数 之 前 ， 该 信号 集 将 被 
加 入 到 进程 的 信号 屏蔽 字 中 。 这 是 一 组 将 被 阻塞 且 不 会 传递 给 该 进程 的 信号 。 设 置信 号 屏蔽 字 可 以 防 
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止 前 面 看 到 的 信号 在 它 的 处 理 函 数 还 未 运行 结束 时 就 被 接收 到 的 情况 。 使 用 sa_masx 字 段 可 以 消除 这 
一 竞 态 条 件 。 

但 是 ， 由 sigaction 函 数 设置 的 信号 处 理 函 数 在 默认 情况 下 是 不 被 重 置 的 ， 如 果 希 望 获得 类 似 前 
面 用 第 二 次 signal 调 用 对 信号 处 理 进行 重 置 的 效果 ， 就 必须 在 sa_flags 成 员 中 包含 值 SA_ 
RESETHAND。 在 深入 了 解 sigaction 函 数 之 前 ， 我 们 先 用 sigaction 替 换 signal 来 重 写 程序 ctrlc.c。 


实验 ction 函 数 


按照 下 面 给 出 的 代码 修改 我 们 的 程序 ， 用 sigaction 来 截获 SIGINT 信 号 。 我 们 将 新 的 程序 命名 为 


ctrlc2.c. 





#include «signal.h» 
#include <stdio.h> 
#include <unistd.h> 


void ouch(int sig) 
( 

printf(*OUCH! - I got signal d\n", sig); 
$ 


int main() 
t 
struct sigaction act; 


act.sa handler = ouch; 
sigemptyset (kact.sa mask); 
act.sa flags = 0; 


Sigaction(SIGINT, &act, 0); 


while(1) ( 
printf(*Hello World! in*); 
sleep(1); 
) 
) 
运行 这 个 新 版 程序 时 ， 只 要 按 下 Ctrl+C 组 合 键 ， 就 可 以 看 到 一 条 消息 。 因 为 sigaction 函 数 连续 
处 理 到 来 的 SIGINT 信 号 。 要 想 终止 这 个 程序 ， 我 们 只 能 按 下 Ctrl\ 组 合 键 ， 它 在 默认 情况 下 产生 
sIGQUIT 信 号 。 
$ ./ctrlc2 
Hello World! 
Hello World! 
Hello World! 
^C 
OUCH! - I got signal 2 
Hello World! 
Hello World! 
^C 
OUCH! - I got signal 2 
Hello World! 
Hello World! 
^x 
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Quit 

$ 

这 个 程序 用 sigaccion 代 赫 signal 来 设置 CtrHC 组 合 键 (srGINT 信 号 ) 的 信号 处 理 函数 为 ouch。 
它 首先 必须 设置 一 个 sigaction 结 构 ， 在 该 结构 中 包含 信号 处 理 函 数 、 信 号 屏蔽 字 和 标志 。 在 本 例 中 ， 
我 们 不 需要 设置 任何 标志 ， 并 通过 调用 新 的 函数 sigempcysec 来 创建 空 的 信号 屏蔽 字 。 


运行 完 这 个 程序 后 ， 你 将 发 现在 当前 目录 下 多 了 一 个 core 文 件 ， 你 可 以 安全 地 删除 它 。 





114.2 ”信号 集 


头 文件 signal.h 定 义 了 类 型 sigset_t 和 用 来 处 理 信号 集 的 函数 。sigaction 和 其 他 函数 将 用 这 
些 信号 集 来 修改 进程 在 接收 到 信号 时 的 行为 。 


#include <signal.h> 


int sigaddset(sigset t *set, int signo); 
int sigemptyset (si; et); 
int sigfillset(sigset t *set); 
int sigdelset(sigset t *set, int signo); 


这 些 函 数 执行 的 操作 如 它们 的 名 字 所 示 。sigemptyset 将 信号 集 初始 化 为 空 。sigfillset 将 信号 
集 初始 化 为 包含 所 有 已 定义 的 信号 。sigaaaset 和 sigdelset 从 信号 集中 增加 或 删除 给 定 的 信号 
(signo)。 它 们 在 成 功 时 返回 0， 失 败 时 返回 -1 并 设置 errno。 只 有 一 个 错误 代码 被 定义 ， 即 当 给 定 的 
信号 无 效 时 ，errno 将 设置 为 EINVAL。 

函数 sigismember 判 断 一 个 给 定 的 信号 是 否 是 一 个 信号 集 的 成 员 。 如 果 是 就 返回 1， 如 果 不 是 ， 
它 就 返回 9， 如 果 给 定 的 信号 无 效 ， 它 就 返回 -1 并 设置 errno 为 EINVAL。 

#include <signal.h> 





int sigismember(sigset t *set, int signo); 
进程 的 信号 屏蔽 字 的 设置 或 检查 工作 由 函数 sigprocmasx 来 完成 。 信 号 屏蔽 字 是 指 当前 被 阻塞 的 
一 组 信号 ， 它 们 不 能 被 当前 进程 接收 到 。 


#include «signal.h» 





int sigprocmask(int how, const sigset t *set, sigset t *oset); 

sigprocmask 函 数 可 以 根据 参数 how 指 定 的 方法 修改 进程 的 信号 屏蔽 字 。 新 的 信号 屏蔽 字 由 参数 
set〈 如 果 它 不 为 空 ) 指定 ， 而 原先 的 信号 屏蔽 字 将 保存 到 信号 集 oset 中 。 

参数 how 的 取 值 可 以 是 表 11-6 中 的 一 个 。 





表 11-6 
SIG BLOCK 把 参数 set 中 的 信号 添加 到 信号 屏蔽 字 中 
SIG_SETMASK 把 信号 屏蔽 字 设 置 为 参数 se 中 的 信号 
SIG UNBLOCK 从 信和 号 屏蔽 字 中 删除 参数 set 中 的 信号 





如 果 参 数 ser 是 空 指针 ，how 的 值 就 没有 意义 了 ,此 时 这 个 调用 的 唯一 目的 就 是 把 当前 信号 屏蔽 字 
的 值 保存 到 oset 中 。 
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如 果 sigprocmask 成 功 完成 ， 它 将 返回 0; 如 果 参 数 how 取 值 无 效 ， 它 将 返回 -1 并 设置 errno 为 
EINVAL. 

如 果 一 个 信号 被 进程 阻塞 ， 它 就 不 会 传递 给 进程 ， 但 会 停留 在 待 处 理 状态 。 程 序 可 以 通过 调用 函 
数 sigpending 来 查看 它 阻塞 的 信号 中 有 哪些 正 停留 在 待 处 理 状态 。 

#include «signal.h» 


int sigpending(sigset t *set); 

这 个 函数 的 作用 是 ， 将 被 阻塞 的 信号 中 停留 在 待 处 理 状态 的 一 组 信号 写 到 参数 set 指 向 的 信号 集 
"b. 成 功 时 它 将 返回 0， 否 则 返回 -1 并 设置 errno 以 表明 错误 的 原因 。 如 果 程 序 需要 处 理 信号 ， 同 时 又 
需要 控制 信号 处 理 函数 的 调用 时 间 ， 这 个 函数 就 很 有 用 了 。 

进程 可 以 通过 调用 sigsuspenad 函 数 挂 起 自己 的 执行 ， 直 到 信号 集中 的 一 个 信号 到 达 为 止 。 这 是 
我 们 前 面 见 到 的 pause 函 数 更 通用 的 一 种 表现 形式 。 

#include <signal.h> 


int sigsuspend(const sigset t *sigmask); 

sigsuspend 函 数 将 进程 的 屏蔽 字 替 换 为 由 参数 sigmask 给 出 的 信号 集 ， 然 后 挂 起 程序 的 执行 。 程 
序 将 在 信号 处 理 函数 执行 完毕 后 继续 执行 。 如 果 接 收 到 的 信号 终止 了 程序 ，sigsuspenad 就 不 会 返回 ， 
如 果 接 收 到 的 信号 没有 终止 程序 ，sigsuspena 就 返回 -1 并 将 errno 设 置 为 EINTR。 

1. sigaction 标 志 

用 在 sigaction 函 数 里 的 sigaction 结 构 中 的 sa_f1ags 字 段 可 以 包含 表 11-7 中 的 取 值 ， 它 们 用 于 
改变 信号 的 行为 。 


表 11-7 
SA_NOCLDSTOP 子 进程 停止 时 不 产生 sIGCHLD 信 号 ” 
SA_RESETHAND 将 对 此 信号 的 处 理 方式 在 信号 处 理 函数 的 入 口 处 重 置 为 STG_DFL 
SA RESTART 重启 可 中 断 的 函数 而 不 是 给 出 ETNTR 错 误 
SA. NODEFER 捕获 到 信号 时 不 将 它 添加 到 信号 屏蔽 字 中 


当 一 个 信号 被 捕获 时 ，SA_RESETHAND 标 志 可 以 用 来 自动 清除 它 的 信号 处 理 函数 ， 就 如 同 我 们 在 
前 面 所 看 到 的 那样 。 

程序 中 使 用 的 许多 系统 调用 都 是 可 中 断 的 。 也 就 是 说 ， 当 接收 到 一 个 信号 时 ， 它 们 将 返回 一 个 错 
误 并 将 errno 设 置 为 ETNTR， 表 明 函 数 是 因为 一 个 信号 而 返回 的 。 使 用 了 信号 的 应 用 程序 需要 特别 注 
意 这 一 行为 。 如 果 sigaction 调 用 中 的 sa_flags 字 段 设 置 了 SA_RESTART 标 志 ， 那 么 在 信号 处 理 函 数 
执行 完 之 后 ， 函 数 将 被 重启 而 不 是 被 信号 中 断 。 

一 般 的 做 法 是 ， 信 号 处 理 函数 正在 执行 时 ， 新 接收 到 的 信号 将 在 该 处 理 函数 的 执行 期 间 被 添加 到 
进程 的 信号 屏蔽 字 中 。 这 防止 了 同一 信号 的 不 断 出 现 引起 信号 处 理 函数 的 再 次 运行 。 如 果 信 号 处 理 函 
数 是 一 个 不 可 重 入 的 函数 ， 在 它 结束 对 第 一 个 信号 的 处 理 之 前 又 让 另 一 个 信号 再 次 调用 它 就 有 可 能 引 
起 问题 。 但 如 果 设 置 了 saA_NODEFER 标 志 ， 当 程序 接收 到 这 个 信号 时 就 不 会 改变 信号 屏蔽 字 。 

信和 号 处 理 函 数 可 以 在 其 执行 期 间 被 中 断 并 再 次 被 调用 。 当 返回 到 第 一 次 调用 时 ， 它 能 否 继续 正确 
操作 是 很 关键 的 。 这 不 仅仅 是 递归 《调用 自身 ) 的 问题 ， 而 是 可 重 入 〈 可 以 安全 地 进入 和 再 次 执行 ) 


外 这 里 指 的 是 进程 暂停 ， 当 子 进程 终止 时 ， 仍 旧 会 产生 sIGCHLD 信 和 号。 一 一 译 者 注 
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的 问题 。Linux 内 核 中 ， 在 同一 时 间 负责 处 理 多 个 设备 的 中 断 服务 例 程 就 需要 是 可 重 入 的 ， 因 为 优先 
级 更 高 的 中 断 可 能 会 在 同一 段 代 码 的 执行 期 间 “ 插 入 ”进来 
表 11-8 中 列 出 的 是 可 以 在 信号 处 理 函 数 中 安全 调用 的 函数 。X/Open 规 范 保证 它们 都 是 可 重 入 的 或 
者 本 身 不 会 再 生成 信号 的 。 
所 有 未 列 在 表 11-8 中 的 函数 ， 在 涉及 信号 处 理 时 ， 都 被 认为 是 不 安全 的 - 


access 
cfsetispeed 
chown 

dup 

fentl 
geteuid 
getpid 

link 

open 

read 
setpgid 
sigaddset 
sigismember 
sigsuspend 
tcdrain 
tcgetpgrp 
time 
unlink 
write 


2. 常用 信号 参考 


表 11-8 
alarm cfgetispeed cfgetospeed 
cfsetospeed chdir chmod 
close creat dup2 
execle execve -exit 
fork fstat getegid 
getgid getgroups getpgrp 
getppid getuid kin 
lseek mkdir mkfifo 
pathcont pause pipe 
rename rmdir setgid 
setsid setuid sigaction 
sigdelset Sigemptyset sigfillset 
signal sigpending sigprocmask 
sleep sysconf 
tcflow tegetattr 
tcsendbreak tcsetpgrp 
uname 
waitpid 





在 这 一 小 节 ， 我 们 列 出 Linux 和 UNIX 程 序 常用 的 信号 及 其 默认 行为 。 

表 11-9 中 信号 的 默认 动作 都 是 异常 终止 进程 ， 进 程 将 以 _exit 调 用 方式 退出 〔 它 类 似 exit， 但 在 
返回 到 内 核 之 前 不 作 任何 清理 工作 )。 但 进程 的 结束 状态 会 传递 到 wait 和 waitpiad 函 数 中 去 ， 从 而 表 
明 进 程 是 因 某 个 特定 的 信号 而 异常 终止 的 





表 11-9 
信和 号 名 称 O A 
SIGALRM 由 alarm 函 数 设置 的 定时 器 产生 
SIGHUP 由 一 个 处 于 非 连接 状态 的 终端 发 送 给 控制 进程 ， 或 者 由 控制 进程 在 自身 结束 时 发 送 给 每 
个 前 台 进程 
SIGINT - 般 由 从 终端 蔽 入 的 Ctrl+C 组 合 键 或 预先 设置 好 的 中 断 字符 产生 
SIGKILL 因为 这 个 信号 不 能 被 捕获 或 忽略 ， 所 以 一 般 在 shell 中 用 它 来 强制 终止 异常 进程 
SIGPIPE 如 果 在 向 管道 写 数 据 时 没有 与 之 对 应 的 读 进程 ， 就 会 产生 这 个 信号 
sron 作为 一 个 请 求 被 发 送 ， 要求 进程 结束 运行 。UNIX 在 关机 时 用 这 个 信号 要 求 系统 服务 停止 


SIGUSR1, SIGUSR2 


运行 。 它 是 xil1 命 令 默认 发 送 的 信号 
进程 之 间 可 以 用 这 个 信号 进行 通信 ， 例 如 让 进程 报告 状态 信息 等 





默认 情况 下, 表 11-10 中 的 信号 也 会 引起 进程 的 异常 终止 。 但 可 能 还 会 有 一 些 与 具体 实现 相关 的 其 
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他 动作 ， 比 如 创建 core 文 件 等 。 





表 11-10 
信号 名 称 说 A 
SIGFPE 由 浮 点 运算 异常 产生 
SIGILL MERRITT FRENO. AN E h ARET R EA JC N BRI AE 
SIGQUIT i dl AA ECRANS II Ctr HL Ar BER FASE GE REFE H PITE 
SIGSEGV 段 冲突 。 一 般 是 因为 对 内 存 中 的 无 效 地 址 进行 读 写 而 引起 的 ， 例 如 超越 数组 边界 或 解 引用 无 效 指 


针 。 当 函数 返回 到 一 个 非法 地 址 时 ， 覆 盖 局 部 数组 变量 和 引起 栈 崩溃 都 会 引发 SrGsBcv 信 和 号 
默认 情况 下 ， 进 程 接收 到 列 在 表 11-11 中 的 信号 时 将 会 被 挂 起 。 
表 11-11 





dt m 
停止 执行 (不 能 被 捕获 或 忽略 》 
终端 挂 起 信号 。 通 常 因 按 下 Cel+Z 组 合 键 而 产生 
SIGTPIN、STGTTOU shell 用 这 两 个 信号 表明 后 台 作业 因 需 要 从 终端 读 取 
输入 或 产生 输出 而 暂停 运行 


SIGCONT 信 号 的 作用 是 重启 被 暂停 的 进程 ， 如 果 进 程 没 有 暂停 ， 则 忽略 该 信号 。sIGCHLD 信 号 在 
默认 情况 下 被 忽略 。 














表 11-12 
信号 名 称 LE] 
SIGCONT 如 果 进 程 被 暂停 ， 就 继续 执行 
SIGCHLD 子 进程 暂停 或 退出 时 产生 


11.5 小结 


在 本 章 中 ， 我 们 知道 了 进程 是 如 何 成 为 Linux 操 作 系统 的 一 个 基本 组 成 部 分 的 。 我 们 学 习 了 如 何 
启动 进程 、 终 止 进程 和 查看 进程 ， 如 何 用 它们 来 解决 程序 设计 问题 。 我 们 还 介绍 了 信号 这 种 可 以 用 来 
控制 程序 运行 行为 的 事件 。 此 外 ， 我 们 还 了 解 了 所 有 的 Linux 进 程 ， 包 括 init 在 内 ， 都 使 用 着 同样 的 
系统 调用 ， 每 个 程序 员 都 可 以 用 它们 来 开发 自己 的 程序 。 
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第 11 章 中 ， 我 们 介绍 了 如 何在 Linux (包括 UNIX) 中 处 理 进程 。 类 UNIX 操 作 系统 早 就 具备 
E 这 种 多 进程 功能 了 。 但 有 时 人 们 认为 ， 用 fork 调 用 来 创建 新 进程 的 代价 太 高 。 在 这 种 情况 
下 ， 如 果 能 让 一 个 进程 同时 做 两 件 事情 或 至 少 看 起 来 是 这 样 将 会 非常 有 用 。 而 且 ， 你 可 能 希望 能 有 两 
件 或 更 多 的 事情 以 一 种 非常 紧密 的 方式 同时 发 生 。 这 就 是 需要 线程 发 挥 作用 的 时 候 了 。 
在 本 章 中 ， 我 们 将 介绍 以 下 内 容 : 
O 在 进程 中 创建 新 线程 
O 在 一 个 进程 中 同步 线程 之 间 的 数据 访问 
口 修改 线程 的 属性 
O 在 同一 个 进程 中 ， 从 一 个 线程 中 控制 另 一 个 线程 
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在 一 个 程序 中 的 多 个 执行 路 线 就 叫做 线程 (thread)。 更 准确 的 定义 是 : 线程 是 一 个 进程 内 部 的 一 
个 控制 序列 。 虽 然 Linux 和 许多 其 他 的 操作 系统 一 样 ， 都 擅长 同时 运行 多 个 进程 ， 但 迄今 为 止 我 们 看 
到 的 所 有 程序 在 执行 时 都 是 作为 一 个 单独 的 进程 。 事实 上 ， 所 有 的 进程 都 至 少 有 一 个 执行 线程 。 到 目 
前 为 止 ， 在 本 书 中 看 到 的 所 有 进程 都 只 有 一 个 执行 线程 。 

弄 清楚 fork 系 统 调用 和 创建 新 线程 之 间 的 区 别 非常 重要 。 当 进程 执行 Etork 调 用 时 , 将 创建 出 该 进 
程 的 一 份 新 副本 。 这 个 新 进程 拥有 自己 的 变量 和 自己 的 PID, 它 的 时 间 调 度 也 是 独立 的 , 它 的 执行 ( 通 
WO 几乎 完全 独立 于 父 进程 。 当 在 进程 中 创建 一 个 新 线程 时 ， 新 的 执行 线程 将 拥有 自己 的 栈 ( 因 此 
也 有 自己 的 局 部 变量 )， 但 与 它 的 创建 者 共享 全 局 变量 、 文 件 描述 符 、 信 号 处 理 函 数 和 当前 目录 状 

线程 的 概念 已 经 出 现 一 段 时 间 了 ， 但 在 IEEE POSIX 委 员 会 发 布 有 关 标 准 之 前 ， 它 们 并 没有 在 类 
UNIX 操 作 系统 中 得 到 广泛 支持 ， 而 且 已 存在 的 线程 实现 版 本 也 因 厂 商 的 不 同 而 有 所 差异 。POSIX 
1003.1c 规 范 的 发 布 改变 了 这 一 切 ， 线 程 不 仅 被 很 好 地 标准 化 了 ， 而 且 现在 绝 大 多 数 Linux 发 行 版 都 已 
支持 它 。 现 在 ， 多 核 处 理 器 即便 对 于 台式 机 也 已 非常 普遍 ， 大 多 数 机 器 在 底层 硬件 上 就 已 物理 支持 了 
同时 执行 多 个 线程 .而 此 前 ,对 于 单 核 CPU 来 说 , 线程 的 同时 执行 只 是 一 个 聪明 、 但 非常 有 效 的 幻觉 。 

Linux 系 统 在 1996 年 第 一 次 获得 线程 的 支持 ， 我 们 常 把 当时 使 用 的 函数 库 称 为 LinuxThread 。 
LinuxThread 已 经 和 POSIX 的 标准 非常 接近 了 (事实 上 ， 从 许多 方面 来 看 ， 它 们 之 前 的 区 别 并 不 明显 )， 
它 是 在 Linux 程 序 设计 中 迈 出 的 很 重要 的 一 步 ， 它 使 Linux 程 序 员 第 一 次 可 以 在 Linux 系 统 中 使 用 线程 。 
但 是 , 在 Linux 的 线程 实现 版 本 和 POSIX 标 准 之 间 还 是 存在 着 细微 的 差别 , 最 明显 的 是 关于 信号 处 理 部 
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分 。 这 些 差 别 中 的 大 部 分 都 受 底 层 Linux 内 核 的 限制 ， 而 不 是 函数 库 实现 所 强加 的 。 

许多 项 目 都 在 研究 如 何 才能 改善 Linux 对 线程 的 支持 ， 这 种 改善 不 仅仅 是 清除 POSIX 标 准 和 Linux 
具体 实现 之 间 的 细微 的 差别 ， 而 且 要 增强 Linux 线 程 的 性 能 和 删除 一 些 不 需要 的 限制 ， 其 中 大 部 分 工 
作 都 集中 在 如 何 将 用 户 级 的 线程 映射 到 内 核 级 的 线程 。 在 这 些 项 目 中 有 两 个 主要 的 项 目 分 别 是 下 一 代 
POSIX 线 程 (New Generation POSIX Thread, 简写 为 NGPT) 和 本 地 POSIX 线 程 库 (Native POSIX Thread 
Library， 简 写 为 NPTL)。 这 两 个 项 目 都 必须 修改 Linux 的 内 核 来 支持 新 的 函数 库 ， 与 旧 的 Linux 线 程 相 
比 ， 两 者 都 极 大 地 提升 了 性 能 。 

2002 年 ，NGPT 项 目 组 宣布 ， 由 于 他 们 不 希望 分 化 线程 团队 ， 所 以 将 停止 为 NGPT 添 加 新 功能 ， 而 
只 是 继续 进行 Linux 上 的 线程 支持 工作 ， 从 而 有 效 地 将 他 们 的 重担 放 到 了 NPTL 的 身上 。 因 此 ， 很 明显 
NPTL 将 成 为 Linux 线 程 的 新 标准 。 第 一 个 NPTL 的 主流 版 本 出 现在 Red Hat Linux 版 本 9 上 。 一 些 有 趣 的 
关于 NPTL 的 背景 资料 可 以 参考 文章 “Linux 上 的 本 地 POSIX 线 程 库 ”(The Native POSIX Thread Library 
for Linux )， 该 文 的 作者 是 Ulrich Drepper 和 Ingo Molnar， 在 撰写 本 书 时 ， 该 文 的 下 载 地 址 为 
http://people.redhat.com/drepper/nptl-design.pdf.. 

本 章 中 的 大 部 分 代码 适用 于 任何 一 种 线程 库 ， 因 为 这 些 代 码 是 基于 POSIX 标 准 的 ， 而 该 标准 普遍 
适用 于 所 有 的 线程 库 。 但 是 ， 如 果 使 用 的 是 旧 的 Linux 发 行 版 ， 你 将 看 到 一 些 细微 的 区 别 ， 特 别 是 用 
ps 命令 查看 本 章 示例 程序 的 运行 情况 时 。 


12.2 ”线程 的 优点 和 缺点 


在 某 些 环境 下 ， 创 建新 线程 要 比 创 建新 进程 有 更 明显 的 优势 。 新 线程 的 创建 代价 要 比 新 进程 小 得 
多 (虽然 与 其 他 一 些 操作 系统 相 比 ，Linux 在 创建 新 进程 方面 的 效率 是 很 高 的 )。 

下 面 是 一 些 使 用 线程 的 优点 。 

口 有 时 ， 让 程序 看 起 来 好 像 是 在 同时 做 两 件 事情 是 很 有 用 的 。 一 个 经 典 的 例子 是 ， 在 编辑 文档 的 
同时 对 文档 中 的 单词 个 数 进行 实时 统计 。 一 个 线程 负责 处 理 用 户 的 输入 并 执行 文本 编辑 工作 ， 
另 一 个 〈 它 也 可 以 看 到 相同 的 文档 内 容 ) 则 不 断 刷 新 单词 计数 变量 。 第 一 个 线程 〈 甚 至 可 以 是 
第 三 个 线程 ) 通过 这 个 共享 的 计数 变量 让 用 户 随时 了 解 自己 的 工作 进展 情况 。 另 一 个 例子 是 一 
个 多 线程 的 数据 库 服 务 器 , 这 是 一 种 明显 的 单 进程 服务 多 用 户 的 情况 。 它 会 在 响应 一 些 请 求 的 
同时 阻塞 另外 一 些 请 求 ， 使 之 等 待 磁盘 操作 ， 从 而 改善 整体 上 的 数据 吞吐 量 。 对 于 数据 库 服务 
器 来 说 , 这 个 明显 的 多 任务 工作 如 果 用 多 进程 的 方式 来 完成 将 很 难 做 到 高 效 ， 因 为 各 个 不 同 的 
进程 必须 紧密 合作 才能 满足 加 锁 和 数据 一 致 性 方面 的 要 求 , 而 用 多 线程 来 完成 就 比 用 多 进程 要 
容易 得 多 。 

O 一 个 混杂 着 输入 、 计 算 和 输出 的 应 用 程序 ， 可 以 将 这 几 个 部 分 分 离 为 3 个 线程 来 执行 ， 从 而 改 
善 程序 执行 的 性 能 。 当 输入 或 输出 线程 等 待 连接 时 ， 另 外 一 个 线程 可 以 继续 执行 。 因 此 ， 如 果 

-个 进程 在 任 一 时 刻 最 多 只 能 做 一 件 事情 的 话 , 线程 可 以 让 它 在 等 待 连接 之 类 的 事情 的 同时 做 
一 些 其 他 有 用 的 事情 . 一 个 需要 同时 处 理 多 个 网 络 连接 的 服务 器 应 用 程序 也 是 一 个 天 生 适 用 于 
应 用 多 线程 的 例子 。 

口 一 般 而 言 , 线程 之 间 的 切换 需要 操作 系统 做 的 工作 要 比 进程 之 间 的 切换 少 得 多 , 因此 多 个 线程 
对 资源 的 需求 要 远 小 于 多 个 进程 。 如 果 一 个 程序 在 逻辑 上 需要 有 多 个 执行 线程 ,那么 在 单 处 理 
器 系统 上 把 它 运 行为 一 个 多 线程 程序 才 更 符合 实际 情况 。 虽然 如 此 , 编写 一 个 多 线程 程序 的 设 
计 困 难 较 大 ， 不 应 等 闲 视 之 。 
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线程 也 有 下 面 一 些 缺点 。 

O 编写 多 线程 程序 需要 非常 仔细 的 设计 。 在 多 线程 程序 中 , 因 时 序 上 的 细微 偏差 或 无 意 造成 的 变 
量 共享 而 引发 错误 的 可 能 性 是 很 大 的 。Alan Cox (Linux 方 面 的 权威 ， 他 撰写 了 本 书 的 序 ) 曾 
经 评论 线程 为 “如 何 立刻 让 自己 自 讨 苦 吃 。” 

口 对 多 线程 程序 的 调试 要 比 对 单线 程 程序 的 调试 困难 得 多 ， 因 为 线程 之 间 的 交互 非常 难于 控制 。 

O 将 大 量 计算 分 成 两 个 部 分 , 并 把 这 两 个 部 分 作为 两 个 不 同 的 线程 来 运行 的 程序 在 一 台 单 处 理 器 
机 器 上 并 不 一 定 运 行 得 更 快 ， 除非 计算 确实 允许 它 的 不 同 部 分 可 以 被 同时 计算 , 而 且 运 行 它 的 
机 器 拥有 多 个 处 理 器 核 来 支持 真正 的 多 处 理 。 
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线程 有 一 套 完整 的 与 其 有 关 的 函数 库 调 用 , 它们 中 的 绝 大 多 数 函 数 名 都 以 pthreaa_ 开 头 。 为 了 使 
用 这 些 函 数 库 调 用 ， 我 们 必须 定义 宏 _REENTRANT， 在 程序 中 包含 头 文件 pthread.h， 并 且 在 编译 程序 
时 需要 用 选项 -1pthreaa 来 链接 线程 库 。 

在 设计 最 初 的 UNIX 和 POSIX 库 例 程 时 ， 人 们 假设 每 个 进程 中 只 有 一 个 执行 线程 一 个 明显 的 例 
子 就 是 errno， 该 变量 用 于 获取 某 个 函数 调用 失败 后 的 错误 信息 。 在 一 个 多 线程 程序 里 ， 默 认 情 况 下 ， 
只 有 一 个 errno 变 量 供 所 有 的 线程 共享 。 在 一 个 线程 准备 获取 刚才 的 错误 代码 时 ， 该 变量 很 容易 被 另 
-个 线程 中 的 函数 调用 所 改变 。 类 似 的 问题 还 存在 于 fputs 之 类 的 函数 中 ， 这 些 函数 通常 用 一 个 个 局 
性 区 域 来 缓存 输出 数据 。 

为 解决 这 个 问题 ， 我 们 需要 使 用 被 称 为 可 重 入 的 例 程 。 可 重 入 代码 可 以 被 多 次 调用 而 仍然 正常 工 
作 ， 这 些 调用 可 以 来 自 不 同 的 线程 ， 也 可 以 是 某 种 形式 的 赃 套 调用 。 因 此 ， 代码 中 的 可 重 入 部 分 通常 
只 使 用 局 部 变量 ， 这 使 得 每 次 对 该 代码 的 调用 都 将 获得 它 自己 的 唯一 的 一 份 数据 副本 。 

编写 多 线程 程序 时 ， 我 们 通过 定义 宏 _REENTRANT 来 告诉 编译 器 我 们 需要 可 重 入 功能 ， 这 个 宏 的 
定义 必须 位 于 程序 中 的 任何 #incluae 语 句 之 前 。 它 将 为 我 们 做 3 件 事情 ， 并 且 做 得 非常 优雅 ， 以 至 于 
我 们 一 般 不 需要 知道 它 到 底 做 了 哪些 事 。 

O 它 会 对 部 分 函数 重新 定义 它们 的 可 安全 重 入 的 版 本 , 这些 函 数 的 名 字 一 般 不 会 发 生 改变 ,只 是 

会 在 函数 名 后 面 添加 _r 字 符 串 。 例 如 ， 函 数 名 gethostbyname 将 变 为 gethostbyname_r。 

口 sedio.h 中 原来 以 宏 的 形式 实现 的 一 些 函数 将 变 成 可 安全 重 入 的 函数 。 

口 在 errno.h 中 定义 的 变量 errno 现 在 将 成 为 一 个 函数 调用 ， 它 能 够 以 一 种 多 线程 安全 的 方式 来 

获取 真正 的 errno 值 。 

在 程序 中 包含 头 文件 pthread.h 还 将 向 我 们 提供 一 些 其 他 的 将 在 代码 中 使 用 到 的 定义 和 函数 原 
型 ， 就 如 同 头 文件 staio.b 为 标准 输入 和 标准 输出 例 程 所 提供 的 定义 一 样 。 最 后 ， 需 要 确保 在 程序 中 
包含 了 正确 的 线程 头 文件 ， 并 且 在 编译 程序 时 链接 了 实现 pthread 函 数 的 正确 的 线程 库 。 有 关 编 译 线 
程 程序 的 更 详细 的 情况 将 在 下 面 的 实验 部 分 中 再 介绍 。 现 在 ， 我 们 首先 来 看 一 个 用 于 管理 线程 的 新 
函数 pthread_create， 它 的 作用 是 创建 一 个 新 线程 ， 类 似 于 创建 新 进程 的 fork 函 数 。 它 的 定义 如 
下 所 示 : 

#include <pthread.h> 














int pthread create(pthread t *thread, pthread attr t *attr, void 
*(*start routine)(void *), void *arg); 


这 个 函数 定义 看 起 来 很 复杂 ， 其 实用 起 来 很 简单 。 第 一 个 参数 是 指向 pchreaa_t 类 型 数据 的 指针 。 
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线程 被 创建 时 ， 这 个 指针 指向 的 变量 中 将 被 写 入 一 个 标识 符 ， 我 们 用 该 标识 符 来 引用 新 线程 。 下 一 个 
参数 用 于 设置 线程 的 属性 。 我 们 一 般 不 需要 特殊 的 属性 ， 所 以 只 需 设 置 该 参数 为 NULL。 我 们 将 在 本 
章 的 后 面 介绍 如 何 使 用 这 些 属性 。 最 后 两 个 参数 分 别 告诉 线程 将 要 启动 执行 的 函数 和 传递 给 该 函数 
的 参数 。 

void *(*start_routine) (void *) 

上 面 一 行 告诉 我 们 必须 要 传递 一 个 函数 地 址 ， 该 函数 以 一 个 指向 voia 的 指针 为 参数 ,返回 的 也 是 
一 个 指向 void 的 指针 。 因 此 ， 可 以 传递 一 个 任 一 类 型 的 参数 并 返回 一 个 任 一 类 型 的 指针 。 用 fork 调 用 
后 ， 父 子 进程 将 在 同一 位 置 继续 执行 下 去 ， 只 是 fork 调 用 的 返回 值 是 不 同 的 ; 但 对 新 线程 来 说 ， 我 们 
必须 明确 地 提供 给 它 一 个 函数 指针 ， 新 线程 将 在 这 个 新 位 置 开 始 执行 。 

该 函数 调用 成 功 时 返回 值 是 0， 如 果 失 败 则 返回 错误 代码 。 手 册页 对 这 个 函数 以 及 在 本 章 中 将 要 
介绍 的 其 他 函数 的 错误 条 件 有 详细 的 说 明 。 

pthread_creace 和 大 多 数 pthreaGL_ 系 列 函 数 一 样 , 在 失败 时 并 未 遵循 UNIX 函 数 的 惯例 

返回 -1， 这 种 情况 在 UNIX 函 数 中 属于 一 少 部 分 。 所 以 除非 你 很 有 把 握 ， 在 对 错误 代码 进行 

检查 之 前 一 定 要 仔细 阅读 使 用 手册 中 的 有 关内 容 - 
通过 调用 pchreaa_exit 函 数 终止 执行 ， 就 如 同 进程 在 结束 时 调用 exit 函 数 一 样 。 这 个 函数 
上 调用 它 的 线程 并 返回 一 个 指向 某 个 对 象 的 指针 。 绝 不 能 用 它 来 返回 一 个 指向 局 
， 因 为 线程 调用 该 函数 后 ， 这 个 局 部 变量 就 不 再 存在 了 ， 这 将 引起 严重 的 程序 漏洞 。 
pthread_exit 函 数 的 定义 如 下 所 示 : 

#include «pthread.h» 












void pthread exit(void *retval); 


in 函数 在 线程 中 的 作用 等 价 于 进程 中 用 来 收集 子 进程 信息 的 wait 函 数 。 这 个 函数 的 





pthread ; 
定义 如 下 所 示 : 

#include <pthread.h> 

int pthread join(pthread t th, void **thread return); 

第 一 个 参数 指定 了 将 要 等 待 的 线程 ， 线 程 通 过 pthread_create 返 回 的 标识 符 来 指定 。 第 二 个 参 
数 是 一 个 指针 ， 它 指向 另 一 个 指针 ， 而 后 者 指向 线程 的 返回 值 。 与 pthread_create 类 似 ， 这 个 函数 
在 成 功 时 返回 0， 失 败 时 返回 错误 代码 。 


实 验 一 个 简单 的 线程 程序 


这 个 程序 创建 一 个 新 线程 ， 新 线程 与 原先 的 线程 共享 变量 ， 并 在 结束 时 向 原先 的 线程 返回 一 个 结 
果 。 没 有 比 这 更 简单 的 多 线程 程序 了 ! 下 面 是 程序 chreadl.c 的 代码 : 

#include <stdio.h> 

#include <unistd.h> 

#include «stdlib.h» 

#include «string.h» 

#include «pthread.h» 


void *thread function(void *arg); 
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char message[] = "Hello World"; 


int main() ( 
int res; 
pthread t a thread; 
void *thread result; 


res = pthread create(&a thread, NULL, thread function, (void *)message); 
if (res != 0) ( 
perror(*Thread creation failed"); 
exit(EXIT FAILURE); 
) 
printf(*Waiting for thread to finish... Wn*); 
res - pthread join(a thread, &thread result); 
if (res !- 0) ( 
perror('Thread join failed*); 
exit(EXIT FAILURE); 
) 
printf('Thread joined, it returned ès\n", (char *)thread result); 
printf(*Message is now $s n", message); 
exit(EXIT SUCCESS); 
) 


void *thread function(void *arg) ( 
printf(*thread function is running. Argument was %s\n", (char *)arg); 
sleep(3) 
strcpy(message, "Bye!*); 
pthread exit("Thank you for the CPU time"); 
) 
(D 编译 这 个 程序 时 ， 我 们 首先 需要 定义 宏 _REENTRANT。 在 少数 系统 上 ， 可 能 还 需要 定义 宏 
-POSIX_C_SOURCE， 但 一 般 不 需要 定义 它 。 
(D) 接 下 来 必须 链接 正确 的 线程 库 。 如 果 使 用 的 是 一 个 老 的 Linux 发 行 版 ,默认 的 线程 库 不 是 NPTL， 
你 可 能 需要 升级 Linux 发 行 版 ， 尽 管 本 章 中 的 大 多 数 代 码 也 兼容 老 的 Linux 线 程 实现 。 简 单 的 检查 方法 
是 查看 头 文件 /usr/incluae/pchreaa.h。 如 果 这 个 文件 中 显示 的 版 权 日 期 是 2003 年 或 更 晚 ， 那 几乎 
可 以 肯定 你 的 Linux 发 行 版 使 用 的 是 NPTL 实 现 。 如 果 日 期 比 这 个 早 ， 你 可 能 就 需要 安装 一 个 较 新 版 本 
的 Linux 了 。 
(3) 在 验证 并 安装 了 正确 的 文件 后 ， 现 在 可 以 编译 和 链接 这 个 程序 了 ， 使 用 的 命令 如 下 所 示 ， 
$ cc -D REENTRANT -I/usr/include/nptl threadl.c 
-o threadl -L/usr/lib/nptl -lpthread 
如 果 你 的 系统 默认 使 用 的 (很 有 可 能 ) 就 是 NPTL 线 程 库 ， 那 么 编译 程序 时 就 无 需 加 上 
-I 和 -L 选 项 。 使 用 的 命令 如 下 所 示 : 
$ cc -D REENTRANT threadi.c -o threadi -1lpthread 
我 们 将 在 本 章 中 一 直 使 用 这 一 简单 版 本 的 命令 行 . 
(4) 运行 这 个 程序 时 ， 你 将 看 到 : 
$ ./threadi 


Waiting for thread to finish... 
thread function is running. Argument was Hello World 
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Thread joined, it returned Thank you for the CPU time 
Message is now Bye! 


这 个 程序 值得 我 们 花 一 点 时 间 去 理解 ， 因 为 它 是 本 章 中 大 多 数 例子 的 基础 。 

[实验 解析 解析 

首先 ， 我 们 定义 了 在 创建 线程 时 需要 由 它 调用 的 一 个 函数 的 原型 。 如 下 所 示 : 

void *thread function(void *arg); 

根据 pthreadq_create 的 要 求 ， 它 只 有 一 个 指向 void 的 指针 作为 参数 ， 返 回 的 也 是 指向 void 的 指 
针 。 稍 后 ， 我 们 将 介绍 这 个 函数 的 实现 。 

在 main 函 数 中 ， 我 们 首先 定义 了 几 个 变量 ， 然 后 调用 pthread_create 开 始 运行 新 线程 。 如 下 
Bios: 


pthread t a thread; 
void *thread result; 





res = pthread create(&a thread, NULL, thread function, (void *)message); 

我 们 向 pthreaG_create 函 数 传递 了 一 个 pchread_t 类 型 对 象 的 地 址 ,今后 可 以 用 它 来 引用 这 个 新 
线程 。 我 们 不 想 改变 默认 的 线程 属性 ， 所 以 设置 第 二 个 参数 为 NULL。 最 后 两 个 参数 分 别 为 将 要 调用 的 
函数 和 一 个 传递 给 该 函数 的 参数 。 

如 果 这 个 调用 成 功 了 ， 就 会 有 两 个 线程 在 运行 。 原 先 的 线程 main) 继续 执 行 pthread_create 
后 面 的 代码 ， 而 新 线程 开始 执行 chreadG_function 函 数 。 

原先 的 线程 在 查 明 新 线程 已 经 启动 后 ， 将 调用 pthread_join 函 数 ， 如 下 所 示 : 

res = pthread join(a thread, &thread result); 

我 们 给 该 函数 传递 两 个 参数 ， 一 个 是 正在 等 待 其 结束 的 线程 的 标识 符 ， 另 一 个 是 指向 线程 返回 值 
的 指针 。 这 个 函数 将 等 到 它 所 指定 的 线程 终止 后 才 返 回 。 然 后 主线 程 将 打印 新 线程 的 返回 值 和 全 局 变 
量 message 的 值 ， 最 后 退出 。 

新 线程 在 threaa_function 函 数 中 开始 执行 ， 它 先 打印 出 自己 的 参数 ， 休 眠 一 会 儿 ， 然 后 更 新 全 
局 变量 ， 最 后 退出 并 向 主线 程 返回 一 个 字符 串 。 新 线程 修改 了 数组 message， 而 原先 的 线程 也 可 以 访 
问 该 数组 。 如 果 我 们 调用 的 是 fork 而 不 是 pthread_create， 就 不 会 有 这 样 的 效果 。 
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接 下 来 ， 我 们 将 编写 一 个 程序 来 验证 两 个 线程 的 执行 是 同时 进行 的 当然， 如 果 是 在 一 个 单 处 理 
器 系统 上 ， 线 程 的 同时 执行 就 需要 靠 CPU 在 线程 之 间 的 快速 切换 来 实现 )。 因 为 还 未 介绍 到 任何 可 以 
帮助 我 们 有 效 地 完成 这 一 工作 的 线程 同步 函数 ， 在 这 个 程序 中 我 们 是 在 两 个 线程 之 间 使 用 轮 询 技术 ， 
所 以 它 的 效率 很 低 。 同 时 ， 我 们 的 程序 仍然 要 利用 这 一 事实 ， 即 除 局 部 变量 外 ， 所 有 其 他 变量 都 将 在 
一 个 进程 中 的 所 有 线程 之 间 共 享 。 


实验 两 个 线程 同时 执行 


在 本 节 中 ， 我 们 创建 的 程序 chread2.c 是 在 对 threadl .c 稍 加 修改 的 基础 上 编写 出 来 的 。 我 们 增 
加 了 另外 一 个 文件 范围 变量 来 测试 哪个 线程 正在 运行 。 如 下 所 示 : 


程序 的 完整 代码 可 以 在 本 书 的 网 站 上 下 载 。 


422 — 5123 POSIX 线程 





int run now = 1; 


我 们 将 在 执行 main 函 数 时 把 run_now 设 置 为 1， 在 执行 新 线程 时 将 其 设置 为 2。 
在 main 函 数 中 ， 我 们 在 创建 新 线程 的 语句 之 后 添加 下 面 的 代码 : 


int print countl = 0; 


while(print countle« < 20) ( 
if (run now == 1) ( 
printf(*1*); 
run now = 2; 
) 
else ( 
sleep(1); 
) 
) 


如 果 run_now 的 值 为 1， 就 打印 "1" 并 设置 它 为 2， 否 则 ， 就 稍 做 休息 然后 再 检查 它 的 值 。 我 们 不 
断 地 检查 来 等 待 它 的 值 变 为 1 这 种 方式 被 称 为 忙 等 待 ， 昌 然 已 经 在 两 次 检查 之 间 休息 1 秒 钟 来 减 慢 检 
查 的 频率 了 。 在 本 章 的 后 面 我 们 将 看 到 对 这 一 问题 的 一 个 更 好 的 解决 方法 。 

在 新 线程 执行 的 thread_function 函 数 中 ， 我 们 所 做 的 事情 和 上 面 的 大 部 分 都 相同 ， 只 是 把 


run_now 的 值 笑 倒 了 一 下 。 如 下 所 示 : 
int print count2 = 0; 


while(print count2«* < 20) ( 
if (run now == 2) ( 
printf(*2*); 
run now = 1; 
) 
else ( 
sleep(1); 
) 
) 


我 们 还 删除 了 参数 的 传递 和 返回 值 的 传递 ， 因 为 现在 我 们 不 再 需要 它们 了 。 

运行 这 个 程序 时 ， 将 看 到 如 下 所 示 的 输出 结果 (你 可 能 会 发 现 程 序 要 过 儿 秒 钟 才 会 产生 输出 ， 特 
别 是 在 一 个 单 核 CPU 的 机 器 上 )。 

$ cc -D REENTRANT thread2.c -o thread2 -lpthread 

$ ./thread2 

12121212121212121212 

Waiting for thread to finish... 

Thread joined 


实验 解析 
每 个 线程 通过 设置 run_now 变 量 的 方法 来 通知 另 一 个 线程 开始 运行 ， 然 后 ， 它 会 等 待 另 一 个 线程 
改变 了 这 个 变量 的 值 后 再 次 运行 。 这 个 例子 显示 了 两 个 线程 之 间 自动 交替 执行 ， 同 时 也 再 次 阐明 了 一 
个 观点 ， 即 这 两 个 线程 共享 run_now 变 量 。 
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12.5 同步 


在 上 一 节 中 ， 我 们 看 到 两 个 线程 同时 执行 的 情况 ， 但 我 们 采用 的 在 它们 之 间 进 行 切换 的 方法 是 非 
常 笨拙 且 没 有 效率 的 。 幸 运 的 是 ， 专 门 有 一 组 设计 好 的 函数 为 我 们 提供 了 更 好 的 控制 线程 执行 和 访问 
代码 临界 区 域 的 方法 。 

我 们 将 在 本 节 学 习 两 种 基本 的 方法 。 一 种 是 信号 量 ， 它 的 作用 如 同 看 守 一 段 代码 的 看 门人 ; 另 一 
种 是 互 斥 量 ， 它 的 作用 如 同 保护 代码 段 的 一 个 互 斥 设备 。 这 两 种 方法 很 相似 ， 事 实 上 ， 它 们 可 以 互相 
通过 对 方 来 实现 。 但 在 实际 应 用 中 ， 对 于 一 些 情况 ， 可 能 使 用 信号 量 或 互 斥 量 中 的 一 个 更 符合 问题 的 
语义 ， 并 且 效果 更 好 。 例 如 ， 如 果 想 控制 任 一 时 刻 只 能 有 一 TETUER EIU 使 用 互 斥 
量 就 要 自然 得 多 。 但 在 控制 对 一 组 相同 对 象 的 访问 时 中 分 配 1 条 给 某 个 线 
程 的 情况 ， 就 更 适合 使 用 计数 信号 量 。 具 体 选择 哪 种 方法 取决 - 于 个 人 偏好 和 相应 的 程序 机 制 。 


12.51 用 信号 量 进行 同步 


有 两 组 接口 函数 用 于 信号 量 。 一 组 取 自 POSIX 的 实时 扩展 ， 用 于 线程 。 另 一 组 被 称 为 系统 V 信 号 
量 ， 常 用 于 进程 的 同步 〈 我 们 将 在 第 14 章 介绍 第 二 组 接口 函数 )。 这 两 组 接口 函数 虽然 很 相近 ， 但 并 
不 保证 它们 之 间 可 以 互 换 ， 而 且 它们 使 用 的 函数 调用 也 各 不 相同 。 

荷兰 计算 机 科学 家 Dijkstra 首 先 提出 了 信号 量 的 概念 。 信 号 量 是 一 个 特殊 类 型 的 变量 ， 它 可 以 被 增 
加 或 减少 ， 但 对 其 的 关键 访问 被 保证 是 原子 操作 ， 即 使 在 一 个 多 线程 程序 中 也 是 如 此 。 这 意味 着 如 果 
-个 程序 中 有 两 个 (或 更 多 ) 的 线程 试图 改变 一 个 信号 量 的 值 ， 系 统 将 保证 所 有 的 操作 都 将 依次 进行 。 
但 如 果 是 普通 变量 ， 来 自 同一 程序 中 的 不 同 线程 的 冲突 操作 所 导致 的 结果 将 是 不 确定 的 。 

在 本 节 中 ， 我们 将 介绍 一 种 最 简单 的 信号 量 一 一 二 进 制 信号 量 ， 它 只 有 0 和 1 两 种 取 值 。 还 有 一 种 
更 通用 的 信号 量 一 一 计数 信号 量 ， 它 可 以 有 更 大 的 取 值 范围 。 信 号 量 一 般 常 用 来 保护 一 段 代码 ， 使 其 
每 次 只 能 被 一 个 执行 线程 运行 ， 要 完成 这 个 工作 ， 就 要 使 用 二 进 制 信号 量 。 有 时 ， 我 们 希望 可 以 允许 
有 限 数目 的 线程 执行 一 段 指定 的 代码 ， 这 就 需要 用 到 计数 信号 量 。 由 于 计数 信号 量 并 不 常用 ， 所 以 我 
们 在 这 里 不 对 它 进行 深入 的 介绍 ， 实 际 上 它 仅 仅 是 二 进 制 信号 量 的 一 种 逻辑 扩展 ， 两 者 实际 调用 的 函 
数 都 一 样 。 

信号 量 函 数 的 名 字 都 以 sem_ 开 头 ， 而 不 像 大 多 数 线程 函数 那样 以 pthread_ 开 头 。 线 程 中 使 用 的 
基本 信号 量 函数 有 4 个 ， 它 们 都 非常 的 简单 。 

信号 量 通过 sem_init 函 数 创建 ， 它 的 定义 如 下 所 示 : 

#include <semaphore.h> 


























int sem init(sem t *sem, int pshared, unsigned int value); 

这 个 函数 初始 化 由 sem 指 向 的 信号 量 对 象 ， 设 置 它 的 共享 选项 (我们 马上 就 会 介绍 到 它 )， 并 给 它 
一 个 初始 的 整数 值 。pshared 参 数控 制 信号 量 的 类 型 ， 如 果 其 值 为 0， 就 表示 这 个 信号 量 是 当前 进程 的 
局 部 信号 量 ， 否 则 ， 这 个 信号 量 就 可 以 在 多 个 进程 之 间 共享 。 我 们 在 这 里 只 对 不 能 在 进程 间 共 享 的 信号 
量 感 兴趣 。 在 编写 本 书 时 ，Linux 还 不 支持 这 种 共享 ， 给 psharea 参 数 传递 一 个 非 零 值 将 导致 调用 失败 。 

接 下 来 的 两 个 函数 控制 信号 量 的 值 ， 它 们 的 定义 如 下 所 示 : 

#include <semaphore.h> 


int sem wait(sem t * sem); 


int sem post(sem t * sem); 
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这 两 个 函数 都 以 一 个 指针 为 参数 ， 该 指针 指向 的 对 象 是 由 sem_init 调 用 初始 化 的 信号 量 。 

sem_post 函 数 的 作用 是 以 原子 操作 的 方式 给 信号 量 的 值 加 1。 所 谓 原子 操作 是 指 ， 如 果 两 个 线程 
企图 同时 给 一 个 信号 量 加 1, 它们 之 间 不 会 互相 干扰 , 而 不 像 如 果 两 个 程序 同时 对 同一 个 文件 进行 读 取 、 
增加 、 写 入 操作 时 可 能 会 引起 冲突 。 信 号 量 的 值 总 是 会 被 正确 地 加 2， 因 为 有 两 个 线程 试图 改变 它 。 

sem_waic 函 数 以 原子 操作 的 方式 将 信号 量 的 值 减 1， 但 它 会 等 待 直 到 信号 量 有 个 非 零 值 才 会 开始 
减法 操作 。 因 此 ， 如 果 对 值 为 2 的 信号 量 调用 sem_wait， 线 程 将 继续 执行 ,但 信号 量 的 值 会 减 到 1。 如 
果 对 值 为 0 的 信号 量 调用 sem_wait， 这 个 函数 就 会 等 待 ， 直 到 有 其 他 线程 增加 了 该 信号 量 的 值 使 其 不 
再 是 0 为 止 。 如 果 两 个 线程 同时 在 sem_wait 调 用 上 等 待 同 一 个 信号 量变 为 非 零 值 ， 那 么 当 该 信号 量 被 
第 三 个 线程 增加 1 时 ， 只 有 其 中 一 个 等 待 线程 将 开始 对 信号 量 减 1， 然 后 继续 执行 ， 另 外 一 个 线程 还 将 
继续 等 待 。 信 号 量 的 这 种 “在 单个 函数 中 就 能 原子 化 地 进行 测试 和 设置 ”的 能 力 使 其 变 得 非常 有 价值 

还 有 另外 一 个 信号 量 函 数 sem_rrywait， 它 是 sem_wait 的 非 阻塞 版 本 . 我 们 不 在 这 里 对 

它 做 更 多 的 介绍 ， 更 详细 的 资料 可 以 参考 它 的 手册 页 . 

最 后 一 个 信号 量 函数 是 sem_aestroy。 这 个 函数 的 作用 是 ， 用 完 信 号 量 后 对 它 进行 清理 。 它 的 定 
AWMF: 

#include <semaphore.h> 





int sem_destroy(sem_t * sem); 

与 前 几 个 函数 一 样 ， 这 个 函数 也 以 一 个 信号 量 指针 为 参数 ， 并 清理 该 信号 量 拥有 的 所 有 资源 。 如 
果 企图 清理 的 信号 量 正 被 一 些 线程 等 待 ， 就 会 收 到 一 个 错误 。 

与 大 多 数 Linux 函 数 一 样 ， 这 些 函 数 在 成 功 时 都 返回 0。 


实验 一 个 线程 信号 量 


这 个 程序 chread3 .c 也 是 基于 chreadl .c 的 。 因 为 改动 的 地 方 比较 多 ， 所 以 我 们 将 其 完整 代码 列 
在 下 面 。 

#include <stdio.h> 

*include <unistd.h> 

#include <stdlib.h> 

#include <string.h> 

#include <pthread.h> 

finclude «semaphore.h» 











void *thread function(void *arg); 
sem t bin sem; 


#define WORK SIZE 1024 
char work area[WORK SIZE]; 


int main() ( 
int res; 
pthread t a thread; 
void *thread result; 


res - sem init(&bin sem, 0, 0); 
if (res !- 0) ( 
perror('Semaphore initialization failed"); 


125 同步 425 





exit(EXIT FAILURE); 
) 
res - pthread create(&a thread, NULL, thread function, NULL); 
if (res != 0) ( 
perror('Thread creation failed"); 
exit(EXIT FAILURE); 
} 
printf("Input some text. Enter 'end' to finish\n"); 
while(strncmp(*end*, work area, 3) != 0) ( 
fgets(work area, WORK SIZE, stdin); 
sem post(&bin sem); 
} 
printf ("\nWaiting for thread to finish.. .\n"); 
res = pthread_join(a_thread, &thread result); 
if (res != 0) { 
perror ("Thread join failed"); 
exit (EXIT_FAILURE) ; 





} 
printf ("Thread joined\n"); 
sem destroy (&bin sem); 
exit (EXIT. SUCCESS) ; 

) 


void *thread function(void *arg) ( 
sem wait (&bin sem); 
while(strncmp("end", work area, 3) != 0) ( 
printf ("You input &d charactersWn', strlen(work area) -1); 
sem wait(&bin sem); 
) 
pthread exit(NULL); 
) 


第 一 个 重要 的 改动 是 包含 了 头 文件 semaphore.h， 它 使 我 们 可 以 访问 信号 量 函数 。 然 后 ， 定 义 一 
个 信号 量 和 几 个 变量 ， 并 在 创建 新 线程 之 前 对 信号 量 进行 初始 化 。 如 下 所 示 : 


sem t bin sem; 


define WORK SIZE 1024 
char work area[WORK SIZE]; 


int main() ( 

int res; 

pthread t a thread; 

void *thread result; 

res - sem init(&bin sem, 0, 0); 

if (res !- 0) ( 
perror('Semaphore initialization failed"); 
exit(EXIT FAILURE); 

] 


注意 ， 我 们 将 这 个 信号 量 的 初始 值 设置 为 0。 
在 main 函 数 中, 启动 新 线程 后 , 我 们 从 键盘 读 取 一 些 文本 并 把 它们 放 到 工作 区 work_area 数 组 中 ， 
然后 调用 sem_post 增 加 信号 量 的 值 。 如 下 所 示 : 
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printf(*Input some text. Enter 'end' to finishin"); 

while(strncmp(*end*, work area, 3) !- 0) { 
fgets(work area, WORK SIZE, stdin); 
sem post(&bin sem); 

) 

在 新 线程 中 ， 我 们 等 待 信号 量 ， 然 后 统计 来 自 输 入 的 字符 个 数 。 如 下 所 示 

sem wait(&bin sem); 

while(strncmp(*end*, work area, 3) != 0) ( 

printf("You input $d characters in', strlen(work area) -1); 
sem wait(&bin sem); 

) 

设置 信号 量 的 同时 ， 我 们 等 待 着 键盘 的 输入 。 当 输入 到 达 时 ， 我 们 释放 信号 量 ， 允 许 第 二 个 线程 
在 第 一 个 线程 再 次 读 取 键 盘 输 入 之 前 统计 出 输入 字符 的 个 数 。 

这 两 个 线程 共享 同一 个 work_area 数 组 。 为 了 让 示例 代码 更 加 简洁 并 容易 理解 ， 我 们 还 省 略 了 一 
些 错误 检查 。 例 如 ， 没 有 检查 sem_waic 函 数 的 返回 值 。 但 在 产品 代码 中 ， 除 非 有 特别 充足 的 理由 才 省 
咯 错误 检查 ， 否 则 我 们 总 是 应 该 检查 函数 的 返回 值 。 

运行 这 个 程序 : 

$ cc -D REENTRANT thread3.c -o thread3 -lpthread 

$ ./thread3 

Input some text. Enter 'end' to finish 

The Wasp Factory 

You input 16 characters 

Iain Banks 

You input 10 characters 

end 


Waiting for thread to finish... 
Thread joined 


在 线程 程序 中 ， 时 序 错误 查找 起 来 总 是 特别 困难 ， 但 这 个 程序 似乎 对 快速 的 文本 输入 和 悠闲 的 暂 
停 都 很 适应 。 

实验 解析 

初始 化 信号 量 时 ， 我 们 把 它 的 值 设置 为 0。 这 样 ， 在 线程 函数 启动 时 ，sem_wait 函 数 调用 就 会 阻 
塞 并 等 待 信号 量变 为 非 零 值 。 

在 主线 程 中 ， 我 们 等 待 直 到 有 文本 输入 ， 然 后 调用 sem_post 增 加 信号 量 的 值 ， 这 将 立刻 令 另 一 个 
线程 从 sem_wait 的 等 待 中 返回 并 开始 执行 。 在 统计 完 字 符 个 数 之 后 ， 它 再 次 调用 sem_wait 并 再 次 被 
阻塞 ， 直 到 主线 程 再 次 调用 sem_post 增 加 信和 号 量 的 值 为 止 。 

我 们 很 容易 忽略 程序 设计 上 的 细微 错误 ， 而 该 错误 会 导致 程序 运行 结果 中 的 一 些 细微 错误 。 我 们 
将 上 面 的 程序 稍 加 修改 并 另存 为 thread3a.c。 它 偶尔 会 将 来 自 键盘 的 输入 用 事先 准备 好 的 文本 自动 
替换 掉 。 我 们 把 main 函 数 中 的 读数 据 循环 修改 为 : 

printf('Input some text. Enter 'end' to finish|in*]; 
while(strnemp(*end', work area, 3) != 0) ( 
if (strnemp(work area, "FAST", 4) == 0) ( 
sem post(&bin sem]; 
strcpy(work area, "Wheeee...*); 


} else { 
fgets(work_area, WORK_SIZE, stdin); 
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) 
sen post(&bin sem); 
) 





现在 ， 如 果 输入 FAST， 程 序 就 会 调用 sem_post 使 字符 统计 线程 开始 运行 ， 同 时 立刻 用 其 他 数据 
更 新 work_area 数 组 。 程 序 运行 情况 如 下 所 示 : 

$ cc -D REENTRANT thread3a.c -o thread3a -lpthread 

$ ./thread3a 

Input some text. Enter 'end' to finish 

Excession 

You input 9 characters 

FAST 

You input 7 characters 

You input 7 characters 

You input 7 characters 

end 


Waiting for thread to finish... 
Thread joined 
问题 在 于 ， 我 们 的 程序 依赖 其 接收 文本 输入 的 时 间 要 足够 长 ， 这 样 另 一 个 线程 才 有 时 间 在 
还 未 准备 好 给 它 更 多 的 单词 去 统计 之 前 统计 出 工作 区 中 字符 的 个 数 。 当 我 们 试图 连续 快 1 
不 同 的 单词 去 统计 时 (键盘 输入 的 FAST 和 程序 自动 提供 的 Weeee…)， 第 二 个 线程 就 没有 时 间 去 执行 。 
但 信号 量 已 被 增加 了 不 止 一 次 ， 所 以 字符 统计 线程 就 会 反复 统计 字符 数目 并 减少 信号 量 的 值 ， 直 到 它 
再 次 变 为 0 为 止 。 








我 们 可 以 再 增加 一 个 信号 量 ， 让 主线 程 等 到 统计 线程 完 
-种 方式 是 使 用 互 斥 量 。 
12.52 ”用 互 斥 量 进行 同步 

另 一 种 用 在 多 线程 程序 中 的 同步 访问 方法 是 使 用 互 斥 量 。 它 允许 程序 员 锁 住 某 个 对 象 ， 使 得 每 次 
只 能 有 一 个 线程 访问 它 。 为 了 控制 对 关键 代码 的 访问 ， 必 须 在 进入 这 段 代码 之 前 锁 住 一 个 互 斥 量 ， 然 
在 完成 操作 之 后 解锁 它 。 

用 于 互 斥 量 的 基本 函数 和 用 于 信号 量 的 函数 非常 相似 ， 它 们 的 定义 如 下 所 示 : 

#include «pthread.h» 





字符 个 数 的 统计 后 再 继续 执行 ， 但 更 简单 的 








int pthread mutex init(pthread mutex t *mutex, const pthread mutexattr t 
*mutexattr); 


int pthread mutex lock(pthread mutex t *mutex)); 
int pthread mutex unlock(pthread mutex t *mutex); 


int pthread mutex destroy(pthread mutex t *mutex); 

与 其 他 函数 一 样 ， 成 功 时 返回 0， 失 败 时 将 返回 错误 代码 ， 但 这 些 函 数 并 不 设置 errno， 你 必须 对 
函数 的 返回 代码 进行 检查 。 

与 信号 量 类似 ， 这 些 函数 的 参数 都 是 一 个 先前 声明 过 的 对 象 的 指针 。 对 互 斥 量 来 说 ， 这 个 对 象 的 
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类 型 为 pchread_mutex_r。pthread_mutex_init 函 数 中 的 属性 参数 允许 我 们 设置 互 斥 量 的 属性 ， 而 
属性 控制 着 互 斥 量 的 行为 。 属 性 类 型 默认 为 fast， 但 它 有 一 个 小 缺点 ， 如 果 程 序 试图 对 一 个 已 经 加 了 
锁 的 互 斥 量 调用 pthread_mutex_lock， 程 序 就 会 被 阻塞 ， 而 又 因为 拥有 互 斥 量 的 这 个 线程 正 是 现在 
被 阻塞 的 线程 ， 所 以 互 斥 量 就 永远 也 不 会 被 解锁 了 ， 程 序 也 就 进入 死 锁 状态 。 这 个 问题 可 以 通过 改变 
互 斥 量 的 属性 来 解决 ， 我 们 可 以 让 它 检查 这 种 情况 并 返回 一 个 错误 ， 或 者 让 它 递归 的 操作 ， 给 同一 个 
线程 加 上 多 个 锁 ， 但 必须 注意 在 后 面 执行 同等 数量 的 解锁 操作 。 

设置 互 斥 量 的 属性 超出 了 本 书 的 讨论 范围 ， 所 以 我 们 将 传递 SuLL 给 属性 指针 ， 从 而 使 用 其 默认 行 
为 。 与 改变 属性 相关 的 更 详细 的 资料 可 以 参考 pthread_mutex_init 的 手册 页 。 





线程 互 


这 个 程序 也 基于 原先 的 threadl .c， 但 改动 的 地 方 比较 多 。 这 次 ， 假 设 需要 保护 对 一 些 关键 变量 
的 访问 ， 我 们 用 一 个 互 斥 量 来 保证 任 一 时 刻 只 能 有 一 个 线程 访问 它们 。 为 了 让 示例 代码 容易 阅读 ， 我 
们 省 略 了 对 互 斥 量 加 锁 和 解锁 调用 的 返回 值 应 该 进行 的 一 些 错误 检查 。 在 软件 代码 中 ， 对 返回 值 的 检 
查 是 必 不 可 少 的 。 下 面 是 新 程序 chreaa4.c 的 代码 : 

#include <stdio.h> 
#include <unistd.h> 
#include <stdlib.h> 
#include <string.h> 
#include «pthread.h» 
#include <semaphore.h> 






void *thread function(void *arg); 
pthread mutex t work mutex; /* protects both work area and time to exit */ 


define WORK SIZE 1024 
char work area[WORK SIZE]; 
int time to exit = 0; 


int main() ( 
int res; 
pthread t a thread; 
void *thread result; 
res = pthread mutex init(&work mutex, NULL); 
if (res != 0) ( 
perror(*Mutex initialization failed*); 
exit(EXIT FAILURE); 
) 
res = pthread create(&a thread, NULL, thread function, NULL); 
if (res != 0) ( 
perror ("Thread creation failed"); 
exit (EXIT, FAILURE) ; 
) 
pthread mutex, lock(&work mutex); 
printf('Input some text. Enter 'end' to finish\n"); 
while(!time to exit) ( 
fgets(work area, WORK SIZE, stdin); 
pthread mutex unlock(&work mutex); 
while(1) ( 
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pthread mutex lock(&work mutex); 
if (work area[0] !- '\0') ( 
pthread mutex unlock (&work mutex); 
sleep(1); 
) 
else ( 
break; 
) 
H 
) 
pthread mutex unlock (&work mutex); 
printf(*WWaiting for thread to finish...in*); 
res = pthread join(a thread, &thread result]; 
if (res != 0) ( 
perror('Thread join failed"); 
exit (EXIT_FAILURE) ; 
) 
printf("Thread joined in"); 
pthread mutex destroy (&work mutex); 
exit(EXIT SUCCESS); 
) 


void *thread function(void *arg) ( 
sleep(1); 
pthread mutex lock(&work  mutex); 
while(strncmp(*end*, work area, 3) != 0) ( 
printf ("You input $d characters n", strlen(work area) -1); 
work area[0] = '\0'; 
pthread mutex unlock(&work mutex); 
sleep(1); 
pthread mutex lock(&work mutex); 
while (work area[0] == '\0' ) ( 
pthread mutex unlock(&work mutex); 
Sleep(1); 
pthread mutex lock(&work mutex); 
) 
) 
time to exit = 1; 
work area[0] = '\0'; 
pthread mutex unlock(&work mutex); 
pthread exit(0); 
) 
$ cc -D REENTRANT thread4.c -o thread4 -lpthread 
$ ./thread4 
Input some text. Enter 'end' to finish 
Whit 
You input 4 characters 
The Crow Road 
You input 13 characters 
end 





Waiting for thread to finish... 
Thread joined 
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实验 解析 
在 程序 的 开始 ， 我 们 声明 了 一 个 互 斥 量 、 工 作 区 和 一 个 变量 rime_to_exic。 如 下 所 示 : 


pthread mutex t work mutex; /* protects both work area and time to exit */ 


$define WORK SIZE 1024 
char work area[WORK SIZE]; 
int time to exit - 0; 


然后 初始 化 互 斥 量 ， 如 下 所 示 : 

res = pthread mutex init(&work mutex, NULL); 

if (res != 0) ( 

perror(*Mutex initialization failed"); 
exit(EXIT FAILURE); 

) 

接 下 来 启动 新 线程 。 下 面 是 在 线程 函数 中 执行 的 代码 : 

pthread mutex lock(&work mutex); 

while(strnemp(*end*, work area, 3) != 0) ( 

printf(*You input èd characters n, strlen(work area) -1); 
work area[0] = '\0'; 
pthread mutex unlock(&work mutex); 
sleepi1); 
pthread mutex lock(&work mutex); 
while (work area[0] == '\0' ) ( 
pthread mutex unlock(&work mutex); 
sleepi1); 
pthread mutex lock(&work mutex); 
) 

) 

time to exit = 1; 

work area[0] = '\0'; 

pthread mutex unlock(&work mutex); 

新 线程 首先 试图 对 互 斥 量 加 锁 。 如 果 它 已 经 被 锁 住 ， 这 个 调用 将 被 阻塞 直到 它 被 释放 为 止 。 一 旦 
获得 访问 权 ， 我 们 就 检查 是 否 有 申请 退出 程序 的 请 求 。 如 果 有 ， 就 设置 time_to_exit 变 量 ， 再 把 工 
作 区 的 第 一 个 字符 设置 为 \0， 然 后 退出 。 

如 果 不 想 退 出 ， 就 统计 字符 个 数 ， 然 后 把 work_area 数 组 中 的 第 一 个 字符 设置 为 mu11。 我 们 用 将 
第 一 个 字符 设置 为 nul1 的 方法 通知 读 取 输 入 的 线程 ， 我 们 已 完成 了 字符 统计 。 然 后 解锁 互 斥 量 并 等 待 
主线 程 继续 运行 。 我 们 将 周期 性 地 尝试 给 互 斥 量 加 锁 ， 如 果 加 锁 成 功 ， 就 检查 是 否 主线 程 又 有 字符 送 
来 要 处 理 。 如 果 还 没有 ， 就 解锁 互 斥 量 继续 等 待 ， 如 果 有 ， 就 统计 字符 个 数 并 再 次 进入 循环 。 

下 面 是 主线 程 的 代码 : 

pthread mutex lock(&work mutex); 

printf(*Input some text. Enter 'end' to finish\n"); 

while(!time to exit) ( 

fgets(work area, WORK SIZE, stdin); 
pthread mutex unlock |&work mutex); 





while(1) { 
pthread mutex lock(&work mutex); 
if (work area[0] !- '\0') ( 


pthread mutex unlock(&work mutex]; 
sleep(1); 
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pthread mutex unlock(&work mutex); 

这 段 代 码 和 上 面 新 线程 中 的 很 类 似 。 我 们 首先 给 工作 区 加 锁 ， 读 入 文本 到 它 里 面 ， 然 后 解锁 以 允 
许 其 他 线程 访问 它 并 统计 字符 数目 。 我 们 周期 性 地 对 互 斥 量 再 加 锁 ， 检 查 字符 数目 是 否 已 统计 完 
(work_area[0] 被 设置 为 nu11)。 如 果 还 需要 等 待 ， 就 释放 互 斥 量 。 如 前 所 述 ， 这 种 通过 轮 询 来 获得 
结果 的 方法 通常 并 不 是 好 的 编程 方式 。 在 实际 的 编程 中 ， 我 们 应 该 尽 可 能 用 信号 量 来 避免 出 现 这 种 情 
况 。 这 里 的 代码 只 是 用 作 示 例 而 已 。 


12.6 ”线程 的 属性 


在 第 一 次 介绍 创建 线程 的 函数 时 ， 我 们 并 未 讨论 更 高 级 的 线程 属性 问题 。 现 在 我 们 已 介绍 完了 同 
步 线程 的 主题 ， 可 以 回头 来 看 这 些 线程 自身 的 更 高 级 特性 了 。 我 们 可 以 控制 的 线程 属性 非常 多 ， 但 在 
这 里 我 们 将 只 介绍 那些 你 最 可 能 用 到 的 ， 其 他 属性 的 详细 资料 可 以 在 手册 页 中 找到 。 

在 前 面 的 所 有 程序 示例 中 ， 我 们 都 在 程序 退出 之 前 用 pchreaa_join 对 线程 再 次 进行 同步 ， 如 果 
我 们 想 让 线程 向 创建 它 的 线程 返回 数据 就 需要 这 样 做 。 但 有 时 也 会 有 这 种 情况 ， 我 们 既 不 需要 第 二 个 
线程 向 主线 程 返回 信息 ， 也 不 想 让 主线 程 等 待 它 的 结束 。 

假设 我 们 在 主线 程 继续 为 用 户 提供 服务 的 同时 创建 了 第 二 个 线程 ， 新 线程 的 作用 是 将 用 户 正在 编 
辑 的 数据 文件 进行 备份 存储 。 备 份 工作 结束 后 ， 第 二 个 线程 就 可 以 直接 终止 了 ， 它 没有 必要 再 回 到 主 
线程 中 。 

我 们 可 以 创建 这 一 类 型 的 线程 ， 它 们 被 称 为 脱离 线程 (detached thread)。 可 以 通过 修改 线程 属性 
或 调用 pthread_ detach 的 方法 来 创建 它们 。 因 为 本 节 的 目的 是 介绍 线程 的 属性 ， 所 以 在 这 里 我 们 就 
使 用 前 一 种 方法 。 

需要 用 到 的 最 重要 的 函数 是 pthread_attr_init， 它 的 作用 是 初始 化 一 个 线程 属性 对 象 。 

#include <pthread.h> 














int pthread attr init(pthread attr t *attr); 

与 前 面 的 函数 一 样 ， 它 在 成 功 时 返回 0， 失 败 时 返回 错误 代码 。 

还 有 一 个 回收 函数 pthread_attr_destroy， 它 的 目的 是 对 属性 对 象 进行 清理 和 回收 。 一 旦 对 象 
被 回收 了 ， 除 非 它 被 重新 初始 化 ， 否 则 就 不 能 被 再 次 使 用 。 

初始 化 一 个 线程 属性 对 象 后 ， 我 们 可 以 调用 许多 其 他 的 函数 来 设置 不 同 的 属性 行为 。 我 们 把 其 中 
主要 的 一 些 函 数列 在 下 面 〈 完 整 的 列表 见 手册 页 ， 通 常 位 于 pthreaa.h 条 目下 )， 但 只 对 其 中 的 两 个 
(detachedstate 和 schedpolicy) 做 详细 的 介绍 : 

#include «pthread.h» 


int pthread attr setdetachstate(pthread attr t *attr, int detachstate); 
int pthread attr getdetachstate(const pthread attr t *attr, int *detachstate); 


int pthread attr setschedpolicy(pthread attr t *attr, int policy); 
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int pthread attr getschedpolicy(const pthread attr t *attr, int *policy); 


int pthread attr setschedparam(pthread attr t *attr, const struct sched param 
*param); 


int pthread attr getschedparam(const pthread attr t *attr, struct sched param 
*param); 


int pthread attr setinheritsched(pthread attr t *attr, int inherit); 

int pthread attr getinheritsched(const pthread attr t *attr, int *inherit); 
int pthread attr setscope(pthread attr t *attr, int scope); 

int pthread attr getscope(const pthread attr t *attr, int *scope); 

int pthread attr setstacksize(pthread attr t *attr, int scope); 


int pthread attr getstacksize(const pthread attr t *attr, int *scope); 


如 你 所 见 ， 可 以 使 用 的 线程 属性 非常 多 。 但 幸运 的 是 ， 你 通常 不 需要 设置 太 多 属性 就 可 以 让 程序 

正常 工作 。 

O detachedstate: 这 个 属性 允许 我 们 无 需 对 线程 进行 重新 合并 。 与 大 多 数 _set 类 函数 一 样 ， 
它 以 一 个 属性 指针 和 一 个 标志 为 参数 来 确定 需要 的 状态 。pthread_attr_setdetachstate 
函数 可 能 用 到 的 两 个 标志 分 别 是 PTHREAD_CREATE_JOINABLE 和 PTHREAD_CREATE_ 
DETACHED。 这 个 属性 的 默认 标志 值 是 PTHREAD_CREATE_JOINABLE， 所 以 可 以 允许 两 个 线程 重 
新 合并 。 如 果 标志 设置 为 PrHREAD_CREATE_DETACHED， 就 不 能 调用 pthread_join 来 获得 另 一 
个 线程 的 退出 状态 。 

口 schedpolicy: 这 个 属性 控制 线程 的 调度 方式 。 它 的 取 值 可 以 是 scHED_OTHER、sSCHED_RP 和 
SCHED_FIFO。 这 个 属性 的 默认 值 为 SCHED_oTHER。 另 外 两 种 调度 方式 只 能 用 于 以 超级 用 户 权 
限 运行 的 进程 ， 因 为 它们 都 具备 实时 调度 的 功能 ， 但 在 行为 上 略 有 区 别 。scHED_RP 使 用 循环 
(round-robin) 调度 机 制 ， 而 scHED_FIFo 使 用 “先进 先 出 ”策略 。 

口 schedparam: 这 个 属性 是 和 schedpolicy 属 性 结合 使 用 的 ， 它 可 以 对 以 scHED_orHER 策 略 运 
行 的 线程 的 调度 进行 控制 。 我 们 将 在 本 章 的 后 面 看 到 一 个 使 用 这 个 属性 的 例子 。 

O inheritsched: 这 个 属性 可 取 两 个 值 ，PTHREAD_EXPLICIT_SCHED 和 PTHREAD_INHERIT_ 
SCHED。 它 的 默认 取 值 是 PrTHREAD_EXPLICIT_scHED， 表 示 调 度 由 属性 明确 地 设置 。 如 果 把 它 
设置 为 PTHREAD_INHERIT_SCHED， 新 线程 将 沿用 其 创建 者 所 使 用 的 参数 。 

O scope: 这 个 属性 控制 一 个 线程 调度 的 计算 方式 。 由 于 目前 Linux 只 支持 它 的 一 种 取 值 
PTHREAD_SCOPE_SYSTEM， 所 以 在 这 里 我 们 就 不 做 进一步 介绍 了 。 

口 stacksize: 这 个 属性 控制 线程 创建 的 栈 大 小 ， 单 位 为 字 节 。 它 属于 POSIX 规 范 中 的 “可 选 ” 
部 分 ， 只 有 在 定义 了 宏 _POSIX_THREAD_ATTR_sTACKSIZE 的 实现 版 本 中 才 支 持 。Linux 在 实现 
线程 时 ， 默 认 使 用 的 栈 很 大 ， 所 以 这 个 功能 对 Linux 来 说 显得 有 些 多 余 。 


JE 设 秆 脱 高 状态 属性 
在 脱离 线程 示例 chread5.c 中 ， 我 们 创建 一 个 线程 属性 ， 将 其 设置 为 脱离 状态 ， 然 后 用 这 个 属性 
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创建 一 个 线程 。 子 线程 结束 时 ， 它 照常 调用 pthreaG_exit， 但 这 次 ， 原 先 的 线程 不 再 等 待 与 它 创建 
的 子 线程 重新 合并 。 主 线程 通过 一 个 简单 的 chread_finishea 标 志 来 检测 子 线程 是 否 已 经 结束 ， 并 显 
示 线 程 之 间 仍 然 共 享 着 变量 。 

#include <stdio.h> 

#include <unistd.h> 


#include <stdlib.h> 
#include <pthread.h> 


void *thread function(void *arg); 


char message[] = "Hello World"; 
int thread_finished = 0; 


int main() ( 


int res; 
pthread t a thread; 


pthread attr t thread attr; 


res = pthread attr init(&thread attr); 

if (res != 0) ( 
perror('Attribute creation failed"); 
exit(EXIT FAILURE); 

) 

res - pthread attr setdetachstate(&thread attr, PTHREAD CREATE, DETACHED) ; 

if (res != 0) { 
perror('Setting detached attribute failed"); 
exit(EXIT FAILURE); 

) 

res = pthread create(&a thread, &thread attr, 


thread function, (void *)message); 


) 


if ( 120) { 
perror ("Thread creation failed"); 


exit (EXIT_FAILURE) ; 





) 

(void)pthread attr destroy(&thread attr); 

while(!thread finished) ( 
printf ("Waiting for thread to say it's finished...Xn*); 
sleep(1); 


printf ("Other thread finished, bye! n"); 
exit(EXIT SUCCESS); 


void *thread function(void *arg) ( 


printf('thread function is running. Argument was $sWn*, (char *)arg!; 
sleep(4); 

printf('Second thread setting finished flag, and exiting nowin"); 
thread finished - 1; 

pthread exit(NULL); 
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输出 结果 是 : 

$ ./thread5 

Waiting for thread to say it's finished... 
thread_function is running. Argument was Hello World 
Waiting for thread to say it's finished... 

Waiting for thread to say it's finished... 

Waiting for thread to say it's finished... 

Second thread setting finished flag, and exiting now 
Other thread finished, bye! 


如 你 所 见 ， 设 置 脱离 状态 属性 可 以 允许 第 二 个 线程 独立 地 完成 工作 ， 而 无 需 原先 的 线程 等 待 它 。 


实验 解析 
这 个 程序 中 有 两 段 比较 重要 的 代码 ， 第 一 段 代码 是 : 


pthread attr t thread attr; 


res = pthread attr init(&thread attr); 
if (res != 0) ( 
perror ("Attribute creation failed"); 
exit (EXIT_FAILURE) ; 
) 
它 声明 了 一 个 线程 属性 并 对 其 进行 初始 化 ， 第 二 段 代码 是 : 
res = pthread attr setdetachstate(&thread attr, PTHREAD CREATE, DETACHED) ; 
if (res != 0) ( 
perror(*Setting detached attribute failed"); 
exit(EXIT FAILURE); 
) 
它 把 属性 的 值 设置 为 脱离 状态 。 
其 他 的 细微 区 别 是 创建 线程 和 传递 属性 的 地 址 : 
res = pthread create(&a thread, &thread attr, thread function, (void 
* message] ; 
属性 用 完 后 ， 对 其 进行 清理 回收 ; 


pthread attr destroy(&thread attr); 





线程 属性 一 一 调度 
我 们 来 看 另外 一 个 可 能 希望 修改 的 线程 属性 : 调度。 改变 调度 属性 和 设置 脱离 状态 非常 类 似 ， 可 
以 用 schea_get_priority_max 和 sched_get_priority_min 这 两 个 函数 来 查找 可 用 的 优先 级 级 别 。 


we 


因为 这 里 的 程序 chreaa6.c 与 前 面 的 例子 很 相似 ， 所 以 我 们 只 显示 它 与 前 面 例子 的 不 同 之 处 。 
(1) 首先 ， 定 义 一 些 额外 的 变量 : 

int max priority; 

int min priority; 

struct sched param scheduling value; 


(2) 设置 好 脱离 属性 后 ， 设 置 调度 策略 : 


127 取消 一 个 线程 — 435 





res = pthread attr setschedpolicy(&thread attr, SCHED OTHER); 
if (res != 0) ( 

perror(*Setting scheduling policy failed"); 

exit (EXIT_FAILURE) ; 
) 


(3) 接 下 来 查找 允许 的 优先 级 范围 : 


max priority = sched get priority max|SCHED OTHER); 
min priority = sched get priority min(SCHED OTHER); 


(4) 然后 设置 优先 级 : 


Scheduling value.sched priority = min priority; 
res = pthread attr setschedparam(&thread attr, &scheduling value); 
if (res !- 0) ( 
perror(*Setting scheduling priority failed"); 
exit(EXIT FAILURE); 
) 


运行 这 个 程序 ， 它 的 输出 如 下 所 示 : 
$ ./threadé 
Waiting for thread to say it's finished... 


thread function is running. Argument was Hello World 
Waiting for thread to s finished... 

Waiting for thread to say it's finished... 

Waiting for thread to say it's finished... 

Second thread setting finished flag, and exiting now 
Other thread finished, bye! 


实验 解析 


这 与 设置 脱离 状态 属性 很 相似 ， 区 别 只 是 我 们 设置 的 是 调度 策略 。 
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有 时 ， 我 们 想 让 一 个 线程 可 以 要 求 另 一 个 线程 终止 ， 就 像 给 它 发 送 一 个 信号 一 样 。 线 程 有 方法 可 
以 做 到 这 一 点 ， 与 信号 处 理 一 样 ， 线 程 可 以 在 被 要 求 终止 时 改变 其 行为 。 

先 来 看 看 用 于 请 求 一 个 线程 终止 的 函数 : 

#include «pthread.h» 








int pthread cancel(pthread t thread); 

这 个 函数 的 定义 简单 易 懂 ， 提 供 一 个 线程 标识 符 ， 我 们 就 可 以 发 送 请 求 来 取消 它 。 但 在 接收 到 取 
消 请 求 的 一 端 ， 事 情 会 稍微 复杂 一 点 ， 不 过 也 不 是 非常 复杂 。 线 程 可 以 用 pthread_setcancelstate 
设置 自己 的 取消 状态 。 

#include <pthread.h> 


int pthread setcancelstate(int state, int *oldstate); 


第 一 个 参数 的 取 值 可 以 是 PTHREAD_CaANCEL_ENABLE， 这 个 值 允 许 线程 接收 取消 请 求 ; 或 者 是 
PTHREAD_CANCEL_DISABLE， 它 的 作用 是 忽略 取消 请 求 。oldstate 指 针 用 于 获取 先前 的 取消 状态 。 如 
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果 你 对 它 没有 兴趣 ， 只 需 传 递 NULL 给 它 。 如 果 取消 请 求 被 接受 了 ， 线 程 就 可 以 进入 第 二 个 控制 层次 ， 
用 pthread_setcanceltype 设 置 取消 类 型 。 
#include «pthread.h» 


int pthread setcanceltype(int type, int *oldtype); 

type 参 数 可 以 有 两 种 取 值 ， 一 个 是 pTHREAD_CANCEL_ASYNCHRONOUS， 它 将 使 得 在 接收 到 取消 请 
求 后 立即 采取 行动 ; 另 一 个 是 PTHREAD_CANCEL_DEFERRED, 它 将 使 得 在 接收 到 取消 请 求 后 ， 一 直 等待 
直到 线程 执行 了 下 述 函数 之 一 后 才 采 取 行动 。 具 体 是 函数 pthreaa_join、pthread_cond_wait、 
pthread_ cond_timedwait、 pthread_testcancel、sem_wait 或 sigwait。 

我 们 在 本 章 中 不 会 对 它们 全 部 进行 介绍 , 因为 并 不 是 所 有 这 些 函 数 都 会 被 经 常用 到 。 与 往常 一 样 ， 
更 详细 的 资料 可 以 在 它们 的 手册 页 中 找到 。 

根据 POSIX 标 准 ， 其 他 可 能 阻塞 的 系统 调用 ， 如 reaG、wait 等 也 可 以 成 为 取消 点 .在 扎 

写本 书 时 ，Linux 还 不 支持 所 有 这 些 系统 调用 都 能 成 为 取消 点 。 但 一 些 实验 证 明 ， 某 些 阻塞 

调用 ， 如 sleep 确 实 允许 取消 动作 的 发 生 为 安全 起 见 ， 你 可 能 会 想 在 估计 会 被 取消 的 代码 

中 添加 一 些 pthread_ testcancel 调 用 。 

oldtype 参 数 可 以 保存 先前 的 状态 ,如果 不 想 知道 先前 的 状态 ,可 以 传递 HULL 给 它 。 默认 情况 下 ， 
线程 在 启动 时 的 取消 状态 为 PFHREAD_CANCEL_ENABLE， 取 消 类 型 是 PTHREAD_ CANCEL_DEFERRED。 


WD Rho ude 
程序 thread7 .c 还 是 基于 chreadl .c。 这 一 次 ， 主 线程 向 它 创建 的 线程 发 送 一 个 取消 请 求 。 


#include <stdio.h> 

#include <unistd.h> 
#include <stdlib.h> 
#include <pthread.h> 








void *thread function(void *arg); 


int main() ( 
int res; 
pthread t a thread; 
void *thread result; 


res = pthread create(&a thread, NULL, thread function, NULL); 
if (res ! 0) { 

perror ("Thread creation failed"); 

exit(EXIT, FAILURE); 
) 


sleep(3); 

printf ("Canceling thread... Wn*); 

res - pthread cancel(a thread); 

if (res != 0) ( 
perror('Thread cancelation failed"); 
exit(EXIT FAILURE); 

J 

printf(*Waiting for thread to finish...Wn*); 
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res = pthread join(a thread, &thread result); 
if (res != 0) ( 

perror("Thread join failed"); 

exit (EXIT_FAILURE 





H 
exit(EXIT SUCCESS); 
) 


void *thread function(void *arg) ( 
int i, res; 
res - pthread setcancelstate(PTHREAD CANCEL ENABLE, NULL); 
if (res != 0) ( 
perror("Thread pthread setcancelstate failed"); 
exit (EXIT_FAILURE) ; 
) 
E pthread setcanceltype(PTHREAD CANCEL DEFERRED, NULL); 
if (res != 0) 
perror('Thread pthread setcanceltype failed"); 
exit(EXIT FAILURE); 








} 

printf(*thread function is running\n"); 

forli = 0; i < 10; i++) ( 
printf(*Thread is still running ($d)... n*, i); 
sleep(1); 


J 
pthread exit(0); 


运行 这 个 程序 时 ， 我 们 将 看 到 如 下 所 示 的 输出 结果 ， 显 示 线 程 已 被 取消 : 
$ ./thread7 

thread function is running 
Thread is still running (0). 
Thread is still running (1). 
Thread is still running (2). 
Canceling thread... 

Waiting for thread to finish... 


$ 


以 通常 的 方法 创建 了 新 线程 后 ， 主 线程 休眠 一 会 儿 (好 让 新 线程 有 时 间 开始 执行 )， 然 后 发 送 一 
个 取消 请 求 。 如 下 所 示 : 
sleep(3); 
printf('Cancelling thread...\n"); 
res = pthread cancel(a thread); 
if (res != 0) ( 
perror ("Thread cancelation failed"); 
exit (EXIT_FAILURE) ; 





* 
在 新 创建 的 线程 中 ， 我 们 首先 将 取消 状态 设置 为 允许 取消 ， 如 下 所 示 : 


res = pthread setcancelstate(PTHREAD CANCEL ENABLE, NULL); 
if (res !- 0) ( 
perror ("Thread pthread setcancelstate failed"); 
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exit (EXIT_FAILURE) ; 
) 
然后 将 取消 类 型 设置 为 延迟 取消 ， 如 下 所 示 : 
res = pthread setcanceltype(PTHREAD CANCEL DEFERRED, NULL); 
if (res != 0) ( 
perror ("Thread pthread setcanceltype failed"); 
exit (EXIT_FAILURE) ; 
) 


最 后 ， 线 程 在 循环 中 等 待 被 取消 ， 如 下 所 示 : 

for(i = 0; i < 10; i++) ( 
printf ("Thread is still running (%d)...\n", i); 
sleepi1); 

) 


128 多 线程 


至 此 ， 我 们 总 是 让 程序 的 主 执行 线程 仅仅 创建 一 个 线程 。 但 我 们 并 不 想 让 读者 认为 你 只 能 多 创建 
-个 线程 。 


X W 多 线程 


在 本 章 最 后 的 例子 chreaa8.c 中 ， 我 们 将 演示 如 何在 同一 个 程序 中 创建 多 个 线程 ， 然 后 又 如 何以 
同 于 其 启动 的 顺序 将 它们 合并 到 一 起 。 

#include <stdio.h> 

finclude <unistd.h> 


#include <stdlib.h> 
#include <pthread.h> 








不 | 


Wdefine NUM THREADS 6 
void *thread function(void *arg); 


int main() ( 
int res; 
pthread t a thread[NUM THREADS]; 
void *thread result; 
int lots of threads; 


for(lots of threads = 0; lots of threads < NUM THREADS; lots of threadse«) ( 
res = pthread create(&(a thread[lots of threads]), 
NULL, thread function, (void *)&lots of threads); 
if (res != 0) { 
perror(*Thread creation failed"); 
exit (EXIT_FAILURE) ; 
) 
sleep(1); 


printf(*Waiting for threads to finish... n"); 
for(lots of threads = NUM THREADS - 1; lots of threads >= 0; 
lots of threads--) ( 


128 多 线程 —439 





res - pthread join(a thread[lots of threads], &thread result); 
if (res == 0) ( 
printf(*Picked up a threadin*); 


Y 
else ( 

perror(*pthread join failed"); 
Y 


H 
printf(*All doneWn*); 
exit(EXIT SUCCESS); 

a 


void *thread function(void *arg) { 
int my number = *(int *)arg; 
int rand num; 


printf(*thread function is running. Argument was %d\n", my number); 
rand numel« (int) (9.0*rand()/(RAND MAX«1.0)); 
Sleep (rand num); 
printf ("Bye from $dWn", my number); 
pthread exit(NULL); 
) 


运行 这 个 程序 时 ， 将 看 到 如 下 所 示 的 输出 结果 : 
$ ./thread& 

thread function is running. Argument was 
thread function is running. Argument was 
thread function is running. Argument was 
thread function is running. Argument was 
thread function is running. Argument was 
Bye from 1 

thread function is running. Argument was 5 
Waiting for threads to finish... 


awneo 


Bye from 5 
Picked up a thread 
Bye from 0 

Bye from 2 

Bye from 3 

Bye from 4 

Picked up a thread 
Picked up a thread 
Picked up a thread 
Picked up a thread 
Picked up a thread 
All done 


如 你 所 见 ， 我 们 创建 了 许多 线程 并 让 它们 以 随意 的 顺序 结束 执行 。 这 个 程序 有 一 个 小 漏洞 ， 如 果 
将 sleep 调 用 从 启动 线程 的 循环 中 删除 ， 它 就 会 变 得 很 明显 。 我 们 通过 它 提醒 读者 ， 在 编写 使 用 线程 
的 程序 时 需要 多 么 小 心 。 你 发 现 错 误 在 哪里 了 吗 ? 我 们 将 在 下 面 的 “实验 解析 ”中 解释 它 。 





这 一 次 ， 我 们 创建 了 一 个 线程 ID 的 数组 ， 如 下 所 示 : 


pthread t a thread[NUM THREADS]; 
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然后 通过 循环 创建 多 个 线程 ， 如 下 所 示 : 
for(lots of threads = 0; lots of threads < NUM THREADS; lots of threads++) ( 
res - pthread create(&(a thread[lots of threads]), NULL, 
thread function, (void *)&lots of threads); 





if (res != 0) ( 
perror ("Thread creation failed"); 
exit(EXIT FAILURE); 
) 
Sleep(1); 
) 
创建 出 的 线程 等 待 一 段 随机 的 时 间 后 退出 运行 ， 如 下 所 示 : 
void *thread function(void *arg) ( 
int my number - *(int *)arg; 
int rand num; 


printf(*thread function is running. Argument was %d\n", my number); 
rand numzle (int) (9.0*rand()/ (RAND MAX«1.0)); 

sleep(rand num); 

printf(*Bye from $dWn*, my number); 

pthread exit (NULL); 


(原先) 线程 中 ,我 们 等 待 合并 这 些 子 线程 ， 但 并 不 是 以 创建 它们 的 顺序 来 合并 ， 如 下 所 示 


for(lots of threads = NUM THREADS - 1; lots of threads >= 0; lots_of_threads--) 





res = pthread join(a thread[lots of threads], &thread result); 
if (res == 0) ( 
printf(*Picked up a threadin*); 
) 
else ( 
perror(*pthread join failed"); 





) 
) 


如 果 删 除 sleep 调 用 后 再 运行 这 个 程序 ， 就 可 能 会 看 到 一 些 奇怪 的 现象 ， 比 如 一 些 线程 以 相同 的 
参数 被 启动 ， 你 可 能 会 看 到 类 似 下 面 的 输出 : 


thread_function is running. Argument was 0 
thread_function is running. Argument was 2 
thread_function is running. Argument was 2 
thread_function is running. Argument was 4 
thread_function is running. Argument was 4 
thread function is running. Argument was 5 
Waiting for threads to finish... 

Bye from 5 

Picked up a thread 

Bye from 2 

Bye from 0 

Bye from 2 

Bye from 4 

Bye from 4 

Picked up a thread 

Picked up a thread 
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Picked up a thread 
Picked up a thread 
Picked up a thread 
All done 


你 能 发 现 为 什么 会 出 现 这 样 的 问题 吗 ? 启动 线程 时 ， 线 程 函数 的 参数 是 一 个 局 部 变量 ， 这 个 变量 
在 循环 中 被 更 新 ， 引 起 问题 的 代码 行 是 : 


for(lots of threads = 0; lots of threads < NUM THREADS; lots_of_threads++) ( 
res = pthread create(&(a thread[lots of threads]), NULL, 
thread function, (void *)&lots of threads]; 
如 果 主 线程 运行 得 足够 快 ， 就 有 可 能 改变 某 些 线程 的 参数 〈 即 1ots_of_threads)。 当 对 共享 变 
量 和 多 个 执行 路 径 没 有 做 到 足够 重视 时 ， 程 序 就 有 可 能 出 现 这 样 的 错误 行为 。 我 们 已 经 敬告 过 ， 编 写 
线程 程序 时 需要 在 设计 上 特别 小 心 。 要 改正 这 个 问题 ， 我 们 可 以 直接 传递 这 个 参数 的 值 ， 如 下 所 示 : 
res = pthread create(&(a thread[lots of threads]), NULL, thread function, (void 
*)1ots of threads); 
当然 还 要 修改 thread_function 函 数 ， 如 下 所 示 : 
void *thread_function(void *arg) { 
int my number = (int)arg; 
这 些 修改 都 在 程序 chread8a.c 中 以 阴影 部 分 显示 出 来 了 ， 如 下 所 示 : 


#include <stdio.h> 
#include <unistd.h> 
#include <stdlib.h> 
#include <string.h> 
#include <pthread.h> 





#define NUM_THREADS 6 
void *thread function(void *arg); 
int main() ( 


int res; 
pthread t a, thread[NUM, THREADS] ; 

void *thread result; 

int lots of threads; 

for(lots of threads = 0; lots of threads < NUM THREADS; lots of threadse«) ( 


res = pthread create(&(a thread[lots of threads]), NULL, 
thread function, (void *)lots of threads); 
if (res != 0) { 
perror ("Thread creation failed"); 
exit (EXIT_FAILURE) ; 





} 

) 

printf ("Waiting for threads to finish... n*]; 

for(lots of threads - NUM THREADS - 1; lots of threads »- 0; lots of threads--) ( 
res - pthread join(a thread[lots of threads], &thread result); 


if (res == 0) ( 
printf('Picked up a thread\n"); 
) else ( 
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perror(*pthread join failed"); 
J 
) 


printf(*All done\n"); 


exit(EXIT SUCCESS); 
) 


void *thread function(void *arg) ( 
int my number = (int)arg; 
int rand num; 


printf('thread function is running. Argument was %d\n", my number); 
rand num-l* (int) (9.0*rand()/ (RAND MAX«1.0)) ; 

Sleep(rand num); 

printf('Bye from d\n", my number); 


pthread exit (NULL); 
H 


12.9 小 结 


在 本 章 中 ， 我 们 介绍 了 如 何在 一 个 进程 中 创建 多 个 执行 线程 ， 每 个 线程 共享 着 文件 范围 的 变量 。 
接着 ， 我 们 介绍 了 线程 对 关键 代码 和 数据 的 两 种 访问 控制 方法 一 一 使 用 信号 量 和 互 斥 量 。 此 后 ， 我 们 
介绍 了 如 何 控制 线程 的 属性 ， 特 别 介绍 了 如 何 才能 将 子 线程 和 主线 程 分 离开 来 ， 使 主线 程 无 需 等 待 它 
创建 的 子 线程 终止 运行 。 在 简单 介绍 完 一 个 线程 如 何 请 求 另 一 个 线程 结束 运行 以 及 接收 端的 线程 如 何 
处 理 这 类 请 求 之 后 ， 我 们 展示 了 一 个 有 多 个 并 发 执行 线程 的 程序 示例 。 

我 们 没有 详细 介绍 每 个 函数 调用 和 与 线程 有 关 的 各 类 事物 ， 但 你 现在 应 该 对 线程 有 了 初步 的 了 解 
了 ， 可 以 尝试 编写 自己 的 线程 程序 了 。 通 过 阅读 相关 的 手册 页 ， 你 可 以 对 线程 有 更 加 深入 的 了 解 。 
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第 11 章 ， 我 们 看 到 了 一 种 在 两 个 进程 间 发 送 消息 的 非常 简单 的 方法 : 使 用 信号 。 我 们 创建 
CE ann. 通过 它 引起 响应 ， 但 传送 的 信息 只 限于 一 个 信号 值 。 
在 本 章 中 ， 我 们 将 介绍 管道 ， 通 过 它 进程 之 间 可 以 交换 更 有 用 的 数据 。 在 本 章 的 最 后 ， 我 们 将 用 
新 学 到 的 知识 将 CD 数据 库 应 用 程序 重新 实现 为 一 个 非常 简单 的 客户 /服务 器 应 用 程序 。 
我 们 将 在 本 章 中 介绍 以 下 几 方 面 的 内 容 : 
a 管道 的 定义 
口 进程 管道 
口 管道 调用 
O 父 进程 和 子 进程 
O 命名 管道 ， FIFO 
口 客户 /服务 器 架构 


13.1 什么 是 管道 


当 从 一 个 进程 连接 数据 流 到 另 一 个 进程 时 ， 我 们 使 用 术语 管道 (pipe)。 我 们 通常 是 把 一 个 进程 的 
输出 通过 管道 连接 到 另 一 个 进程 的 输入 。 

大 多 数 Linux 的 用 户 应 该 早已 对 将 shell 命 令 连接 在 一 起 的 概念 很 熟悉 了 , 这 实际 上 就 是 把 一 个 进程 
的 输出 直接 传递 给 另 一 个 进程 的 输入 。 对 于 shell 命 令 来 说 ， 命 令 的 连接 是 通过 管道 字符 来 完成 的 ， 如 
下 所 示 : 

emdl | cmd2 


shell 负 责 安 排 两 个 命令 的 标准 输入 和 标准 输出 。 

O cma1 的 标准 输入 来 自 终 端 键盘 。 

O cmal 的 标准 输出 传递 给 cma2， 作 为 它 的 标准 输入 。 

O cma2 的 标准 输出 连接 到 终端 屏幕 。 

shell 所 做 的 工作 实际 上 是 对 标准 输入 和 标准 输出 流 进行 了 重新 连接 ， 使 数据 流 从 键盘 输入 通过 两 
个 命令 最 终 输 出 到 屏幕 上 ， 见 图 13-1。 

在 本 章 中 ， 我 们 将 看 到 如 何在 程序 中 获得 这 样 的 效果 ， 怎 样 用 管道 将 多 个 进程 连接 起 来 ， 从 而 实 
现 一 个 简单 的 客户 /服务 器 系统 。 
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图 13-1 
13.2 ”进程 管道 
可 能 最 简单 的 在 两 个 程序 之 间 传 递 数 据 的 方法 就 是 使 用 popen 和 pclose 函 数 了 。 它 们 的 原型 如 下 
Bim: 


#include «stdio.h» 

FILE *popen(const char *command, const char *open mode); 

int pclose(FILE *stream to close); 

1. popen 函 数 

popen 函 数 允 许 一 个 程序 将 另 一 个 程序 作为 新 进程 来 启动 ， 并 可 以 传递 数据 给 它 或 者 通过 它 接收 
数据 。commana 字 符 串 是 要 运行 的 程序 名 和 相应 的 参数 。open_mode 必 须 是 "r" 或 者 "w"。 

如 果 open_mode 是 "r"， 被 调用 程序 的 输出 就 可 以 被 调用 程序 使 用 ， 调 用 程序 利用 popen 函 数 返回 
的 FILE* 文 件 流 指针 ， 就 可 以 通过 常用 的 staio 库 函数 如 freaa) 来 读 取 被 调用 程序 的 输出 。 如 果 
open_mode 是 "w"， 调 用 程序 就 可 以 用 fwrite 调 用 向 被 调用 程序 发 送 数据 ， 而 被 调用 程序 可 以 在 自己 
的 标准 输入 上 读 取 这 些 数据 。 被 调用 的 程序 通常 不 会 意识 到 自己 正在 从 另 一 个 进程 读 取 数据 ， 它 只 是 
在 标准 输入 流 上 读 取 数 据 ， 然 后 做 出 相应 的 操作 。 

每 个 popen 调 用 都 必须 指定 "z" 或 "w"， 在 popen 函 数 的 标准 实现 中 不 支持 任何 其 他 选项 。 这 意味 
着 我 们 不 能 调用 另 一 个 程序 并 同时 对 它 进行 读 写 操作 。popen 函 数 在 失败 时 返回 一 个 空 指针 。 如 果 想 
通过 管道 实现 双向 通信 ， 最 普通 的 解决 方法 是 使 用 两 个 管道 ， 每 个 管道 负责 一 个 方向 的 数据 流 。 

2. pclose 函 数 

用 popen 启 动 的 进程 结束 时 ， 我 们 可 以 用 pclose 函 数 关闭 与 之 关联 的 文件 流 。pclose 调 用 只 在 
popen 启 动 的 进程 结束 后 才 返 回 。 如 果 调 用 pclose 时 它 仍 在 运行 ，pclose 调 用 将 等 待 该 进程 的 结束 。 

pclose 调 用 的 返回 值 通常 是 它 所 关闭 的 文件 流 所 在 进程 的 退出 码 。 如 果 调 用 进程 在 调用 pclose 
之 前 执行 了 一 个 wait 语 句 ， 被 调用 进程 的 退出 状态 就 会 丢失 ， 因 为 被 调用 进程 已 结束 。 此 时 ，pclose 
将 返回 -1 并 设置 errno 为 ECHILD。 


辆 可 | 读 取 外 部 程序 的 输出 


现在 来 看 一 个 简单 的 popen 和 pclose 示 例 程 序 popen1.c。 我 们 将 在 程序 中 用 popen 访 问 uname 命 
令 给 出 的 信息 。 命 令 uname -a 的 作用 是 打印 系统 信息 ， 包 括 计 算 机 型 号 、 操 作 系 统 名 称 、 版 本 和 发 行 
号 ， 以 及 计算 机 的 网 络 名 。 

完成 程序 的 初始 化 工作 后 ， 打 开 一 个 连接 到 uname 命 令 的 管道 ， 把 管道 设置 为 可 读 方式 并 让 
reaqd_fp 指 向 该 命令 的 输出 。 最 后 ， 关 闭 read_fp 指 向 的 管道 。 
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#include <unistd.h> 
#include <stdlib.h> 
#include <stdio.h> 
#include «string.h» 


int main() 


FILE *read fp; 
char buffer[BUFSIZ « 1]; 
int chars read; 
memset (buffer, '\0', sizeof(buffer]); 
read fp = popen(*uname -a*, "r*); 
if (read fp != NULL) ( 
Chars read = fread(buffer, sizeof(char), BUFSIZ, read fp); 
if (chars read » 0) ( 
printf('Output was:-\nês\n*, buffer); 
) 
pclose(read fp); 
exit(EXIT, SUCCESS) ; 
) 
exit(EXIT FAILURE); 
) 


运行 这 个 程序 ， 我 们 将 看 到 如 下 所 示 的 输出 结果 这 是 在 本 书 其 中 一 位 作者 的 机 器 上 的 输出 结 
W): 


$ ./popeni 

Output was: - 

Linux susel03 2.6.20.2-2-default #1 SMP Fri Mar 9 21:54:10 UTC 2007 i686 i686 i386 
GNU/Linux 


实验 解析 

这 个 程序 用 popen 调 用 启动 带 有 -a 选项 的 uname 命 令 。 然 后 用 返回 的 文件 流 读 取 最 多 BUFsIz 个 字 
符 〈 这 个 常量 是 在 staio.h 中 用 #define 语 句 定义 的 ) 的 数据 ， 并 将 它们 打印 出 来 显示 在 屏幕 上 。 因 
为 我 们 是 在 程序 内 部 捕获 uname 命 令 的 输出 ， 所 以 可 以 处 理 它 。 
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看 过 捕获 外 部 程序 输出 的 例子 后 ， 我 们 再 来 看 一 个 将 输出 发 送 到 外 部 程序 的 示例 程序 popen2.c， 
它 将 数据 通过 管道 送 往 另 一 个 程序 。 我 们 在 这 里 使 用 的 是 ca (八进制 输出 ) 命令 。 


同时 | 将 输 出 送 往外 部 程序 


我 们 可 以 看 到 ， 下 面 这 个 程序 popen2 .c 非 常 类 似 于 前 面 的 示例 程序 ,唯一 的 不 同 是 这 个 程序 是 将 数据 
写 入 管道 ， 而 不 是 从 管道 中 读 取 。 

#include <unistd.h> 

#include «stdlib.h» 

#include <stdio.h> 

#include <string.h> 
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int main() 
t 
FILE *write fp; 
Char buffer[BUFSIZ * 1]; 


sprintf(buffer, "Once upon a time, there was... |n"); 
write fp = popen("od -c*, *w*); 
if (write fp !- NULL) ( 
fwrite(buffer, sizeof(char), strlen(buffer), write fp); 
pclose(write fp); 
exit(EXIT SUCCESS); 


) 
exit(EXIT FAILURE); 
D: 


运行 这 个 程序 时 ， 我 们 将 看 到 如 下 所 示 的 输出 结果 : 


$ ./popen2 
000000 O n c e u p o n a t i m e 
0000020 , t h 6 v eè 机 


0000037 

程序 使 用 带 有 参数 "w" 的 popen 启 动 oa -c 命 令 ， 这 样 就 可 以 向 该 命令 发 送 数据 了 。 然 后 它 给 oa -c 
命令 发 送 一 个 字符 串 ， 该 命令 接收 并 处 理 它 ， 最 后 把 处 理 结果 打印 到 自己 的 标准 输出 上 。 

在 命令 行 上 ， 我 们 可 以 用 下 面 的 命令 得 到 同样 的 输 t 1 

$ echo "Once upon a time, there was..." | od -c 





13.3.3. 传递 更 多 的 数据 


我 们 目前 所 使 用 的 机 制 都 只 是 将 所 有 数据 通过 一 次 Eread 或 fwrite 调 用 来 发 送 或 接收 。 有 时 ， 我 
们 可 能 希望 能 以 块 方式 发 送 数据 ， 或 者 我 们 根本 就 不 知道 输出 数据 的 长 度 。 为 了 避免 定义 一 个 非常 大 
的 缓冲 区 ， 我 们 可 以 用 多 个 tread 或 ftwrite 调 用 来 将 数据 分 为 儿 部 分 处 理 。 

下 面 这 个 程序 popen3 .c 通 过 管道 读 取 所 有 数据 。 


实 验 通过 管道 读 取 大 量 数据 


在 这 个 程序 中 ， 我 们 从 被 调用 的 进程 ps ax 中 读 取 数 据 。 该 进程 输出 的 数据 有 多 少 事先 无 法 知道 ， 
所 以 我 们 必须 对 管道 进行 多 次 读 取 。 





#include <unistd.h> 
#include <stdlib.h> 
#include <stdio.h> 
#include <string.h> 


int main() 

T 
FILE *read fp; 
Char buffer[BUFSIZ + 1]; 
int chars read; 
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memset (buffer, '\0', sizeof(buffer)]); 
read fp = popen(*ps ax", 'r*); 
if (read fp != NULL) ( 
chars read - fread(buffer, sizeof(char), BUFSIZ, read fp); 
while (chars read » 0) ( 
buffer[chars read - 1] = '\0'; 
printf('Reading $d:-in %s\n", BUFSIZ, buffer); 
chars read = fread(buffer, sizeof(char), BUFSIZ, read fp); 
) 
pclose(read fp); 
exit(EXIT SUCCESS); 
) 
exit (EXIT_FAILURE) ; 
} 


为 简洁 起 见 ， 我 们 对 程序 的 输出 做 了 一 些 修 改 ， 如 下 所 示 : 


$ ./popen3 
Reading 1024:- 
PID TTY STAT TIME COMMAND 


1 ? Ss 0:03 init [5] 

2 ? SW 0:00 [kflushd] 

3 ? SW 0:00 [kpiod] 

4 ? SW 0:00 [kswapd] 

5 ? SW« 0:00 [mdrecoveryd) 


240 tty2 S — 0:02 emacs draftl.txt 
Reading 1024:- 

368 ttyl S — 0:00 ./popen3 

369 tty R — 0:00 ps -ax 


这 个 程序 调用 popen 函 数 时 使 用 了 "r" 参 数 ， 这 与 popen1.c 程 序 的 做 法 一 样 。 这 次 ， 它 连续 从 文 
件 流 中 读 取 数据 ， 直 到 没有 数据 可 读 为 止 。 注 意 ， 虽 然 ps 命令 的 执行 要 花费 一 些 时 间 ， 但 Linux 会 安 
排 好 进程 间 的 调度 ， 让 两 个 程序 在 可 以 运行 时 继续 运行 。 如 果 读 进程 popen3 没 有 数据 可 读 ， 它 将 被 挂 
起 直到 有 数据 到 达 。 如 果 写 进程 ps 产生 的 输出 超过 了 可 用 缓冲 区 的 长 度 ， 它 也 会 被 挂 起 直到 读 进程 读 
取 了 一 些 数据 。 

在 本 例 中 ， 你 可 能 不 会 看 到 Reading: -信息 的 第 二 次 出 现 。 如 果 BUFsIz 的 值 超过 了 ps 命令 输出 的 
长 度 ， 这 种 情况 就 会 发 生 。 一 些 〈 最 新 的 ) Linux 系 统 将 BUFSIzZ 设 置 为 8 192 或 更 大 的 数字 。 为 了 测试 
程序 在 读 取 多 个 输出 数据 块 时 能 够 正常 工作 ， 你 可 以 尝试 每 次 读 取 少 于 BUFsIz 个 字符 (比如 
BUFSIZE/10 个 字符 )。 





13.8.2 如何 实现 popen 

请 求 popen 调 用 运行 一 个 程序 时 ， 它 首先 启动 shell， 即 系统 中 的 sh 命令 ， 然 后 将 commana 字 符 囊 
作为 一 个 参数 传递 给 它 。 这 有 两 个 效果 ， 一 个 好 ， 一 个 不 太 好 。 

在 Linux〈 以 及 所 有 的 类 UNIX 系 统 ) 中 ， 所 有 的 参数 扩展 都 是 由 shell 来 完成 的 。 所 以 ， 在 启动 程 
序 之 前 先 启动 shell 来 分 析 命令 字符 串 ， 就 可 以 使 各 种 shell 扩 展 〈 如 *.c 所 指 的 是 哪些 文件 ) 在 程序 启 
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动 之 前 就 全 部 完成 。 这 个 功能 非常 有 用 ， 它 允许 我 们 通过 popen 启 动 非常 复杂 的 shell 命 令 。 而 其 他 一 
些 创 建 进程 的 函数 〈 如 exec1) 调用 起 来 就 复杂 得 多 ， 因 为 调用 进程 必须 自己 去 完成 shell 扩 展 。 

使 用 shell 的 一 个 不 太 好 的 影响 是 ， 针 对 每 个 popen 调 用 ， 不 仅 要 启动 一 个 被 请 求 的 程序 ， 还 要 启 
动 一 个 shell， 即 每 个 popen 调 用 将 多 启动 两 个 进程 。 从 节省 系统 资源 的 角度 来 看 ，popen 函 数 的 调用 成 
本 略 高 ， 而 且 对 目标 命令 的 调用 比 正常 方式 要 惕 一 

我 们 用 程序 popen4 .c 来 演示 popen 函 数 的 行为 。 这 个 程序 对 所 有 popen 示 例 程序 的 源 文 件 的 总 行 
数 进行 统计 ， 方 法 是 用 cat 命 令 显 示 文 件 的 内 容 并 将 输出 通过 管道 传递 给 命令 wc -1， 由 后 者 统计 总 行 
数 。 如 果 是 在 命令 行 上 完成 这 一 任务 ， 我 们 可 以 使 用 如 下 命令 : 

$ cat popen*.c | wc -1 

事实 上 ， 输 入 命令 wc -1 popen* .c 更 简单 而 且 更 有 效率 ， 但 我 们 是 为 了 通过 这 个 例子 
RIR s popenif th LRL. 


E3 EJ popen 启 动 shell 


这 个 程序 使 用 上 面 给 出 的 命令 ， 但 是 通过 popen 来 读 取 命令 输出 的 结果 : 
#include <unistd.h> 
#include «stdlib.h» 
#include <stdio.h> 
#include <string.h> 









int main() 


FILE *read fp; 
char buffer[BUFSIZ + 1]; 
int chars read; 


memset (buffer, '\0', sizeof(buffer)); 
read fp = popen(*cat popen*.c | wc -l', *r*); 
if (read fp != NULL) ( 
chars read = fread(buffer, sizeof(char), BUFSIZ, read fp); 
while (chars read » 0) ( 
buffer[chars read - 1] = 'X0'; 
printf ("Reading:-\n %s\n", buffer); 
chars read = fread(buffer, sizeof (char), BUFSIZ, read fp); 
) 
pclose(read fp); 
exit(EXIT SUCCESS); 
) 
exit(EXIT FAILURE); 
) 


运行 这 个 程序 时 ， 我 们 将 看 到 如 下 所 示 的 输出 结果 : 


$ ./popen4 
Reading:- 
94 


这 个 程序 显示 ，shell 在 启动 后 将 popen* .c 扩 展 为 一 个 文件 列表 , 列表 中 的 文件 名 都 以 popen 开 头 ， 
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以 .c 结 尾 ，shell 还 处 理 了 管道 符 ( | ) 并 将 cat 命 令 的 输出 传递 给 wc 命令 。 我 们 在 一 个 popen 调 用 中 启 
动 了 shell、cat 程 序 和 wc 程序 ， 并 进行 了 一 次 输出 重 定向 。 而 调用 这 些 命令 的 程序 只 看 到 最 终 的 输出 
结果 。 





13.4 pipe 调用 


在 看 过 高 级 的 popen 函 数 之 后 ， 我 们 再 来 看 看 底层 的 pipe 函 数 。 通 过 这 个 函数 在 两 个 程序 之 间 传 
递 数据 不 需要 启动 一 个 shell 来 解释 请 求 的 命令 。 它 同时 还 提供 了 对 读 写 数 据 的 更 多 控制 。 

Pipe 函数 的 原型 如 下 所 示 : 

#include «unistd.h» 


int pipe(int file descriptor[2]); 

Pipe 函数 的 参数 是 一 个 由 两 个 整数 类 型 的 文件 描述 符 组 成 的 数组 的 指针 。 该 函数 在 数组 中 填 上 两 
个 新 的 文件 描述 符 后 返回 0， 如 果 失 败 则 返回 -1 并 设置 errno 来 表明 失败 的 原因 。 在 Linux 手 册页 ( 手 
册 的 第 二 部 分 ) 中 定义 了 下 面 一 些 错误 。 

口 EMFILE: 进程 使 用 的 文件 描述 符 过 多 。 

O ENFILE: 系统 的 文件 表 已 满 。 

口 EFAULT: 文件 描述 符 无 效 。 

两 个 返回 的 文件 描述 符 以 一 种 特殊 的 方式 连接 起 来 。 写 到 file_descriptor [1] 的 所 有 数据 都 可 
以 从 file_qescriptor[0] 读 回来 。 数 据 基于 先进 先 出 的 原则 (通常 简写 为 FIFO》 进 行 处 理 ， 这 意味 
着 如 果 你 把 字 节 1，2，3 写 到 file_descriptor[1]， 从 file_descriptor[0] 读 取 到 的 数据 也 会 是 1， 
2，3。 这 与 栈 的 处 理 方式 不 同 ， 栈 采用 后 进 先 出 的 原则 ， 通 常 简写 为 LIFO。 

特别 要 注意 ， 这 里 使 用 的 是 文件 描述 符 而 不 是 文件 流 ， 所 以 我 们 必须 用 底层 的 read 和 
write 调用 来 访问 数据 ， 而 不 是 用 文件 流 库 函 数 fread 和 fwrite。 


下 面 的 程序 pipel .c 用 pipe 函 数 来 创建 一 个 管道 。 


Ee 


注意 file_pipes 数 组 的 用 法 ， 它 的 地 址 被 当 作 参数 传递 给 pipe 函 数 。 


Winclude «unistd.h» 
#include «stdlib.h» 
#include «stdio.h» 
finclude <string.h> 


int main() 
int data processed; 
int file pipes[2]; 
const char some data[] = "123"; 
;char buffer[BUFSIZ + 1]; 
memset (buffer, '\0', sizeof(buffer)); 


if (pipe(file pipes) == 0) ( 
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Gata processed = write(file pipes[1], some data, strlen(some data)); 
printf(*Wrote $d bytes in", data processed); 
data processed = read(file pipes[0], buffer, BUFSIZ); 
printf(*Read %d bytes: s\n", data processed, buffer); 
exit(EXIT SUCCESS); 
) 
exit(EXIT FAILURE); 


运行 这 个 程序 时 ， 输 出 结果 如 下 所 示 : 
$ ./pipel 

Wrote 3 bytes 

Read 3 bytes: 123 


这 个 程序 用 数组 file_pipes[] 中 的 两 个 文件 描述 符 创建 一 个 管道 。 然 后 它 用 文件 描述 符 
file_pipes[1] 向 管道 中 写 数据 ， 再 从 file_pipes[0] 读 回 数据 。 注 意 ， 管 道 有 一 些 内 置 的 缓存 区 ， 
它 在 write 和 read 调 用 之 间 保存 数据 。 

如 果 你 尝试 用 file_descriptor[0] 写 数据 或 用 file_descriptor[1] 读 数据 ,其 后 果 并 未 在 文档 
中 明确 定义 ， 所 以 其 行为 可 能 会 非常 奇怪 ， 并 且 随 着 系统 的 不 同 ， 其 行为 可 能 会 发 生变 化 。 在 我 的 系 
统 上 ， 这 样 的 调用 将 失败 并 返回 -1， 这 至 少 能 够 说 明 这 种 错误 比较 容易 发 现 。 

乍 看 起 来 ， 这 个 使 用 管道 的 例子 并 无 特别 之 处 ， 它 做 的 工作 也 可 以 用 一 个 简单 的 文件 完成 。 管 道 
的 真正 优势 体现 在 ， 当 你 想 在 两 个 进程 之 间 传 递 数据 的 时 候 。 我 们 在 第 12 章 讲 过 ， 当 程序 用 fork 调 用 
创建 新 进程 时 ， 原 先 打开 的 文件 描述 符 仍 将 保持 打开 状态 。 如 果 在 原先 的 进程 中 创建 一 个 管道 ， 然 后 
再 调用 fork 创 建新 进程 ， 我 们 即 可 通过 管道 在 两 个 进程 之 间 传 递 数据 。 





*w 跨越 fork 调 用 的 管 


(1) 下 面 这 个 程序 pipe2.c 的 开始 部 分 (在 调用 fork 之 前 的 部 分 ) 和 第 一 个 例子 非常 相似 。 


#include <unistd.h> 
#include «stdlib.h» 
#include <stdio.h> 
#include <string.h> 


int main() 

t 
int data processed; 
int file pipes[2]; 
const char some data[] = *123*; 
char buffer[BUPSIZ + 1]; 
pid t fork result; 








memset(buffer, '\0', sizeof(buffer)); 


if (pipe(file pipes) -- 0) ( 
fork result - fork(); 
if (fork result -- -1) ( 
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fprintf(stderr, "Fork failure"); 
exit (EXIT_FAILURE) ; 
) 


Q) 在 确认 fork 调 用 成 功 后 ， 如 果 fork_result 等 于 零 ， 就 说 明 我 们 是 在 子 进程 中 ， 如 下 所 示 ， 


if (fork result == 0) ( 
data processed - read(file pipes[0], buffer, BUFSIZ); 
printf(*Read &d bytes: $sin*, data processed, buffer]; 
exit(EXIT SUCCESS); 

) 


(3) 否则 ， 我 们 肯定 是 在 父 进程 中 ， 如 下 所 示 : 
lse ( 
1 ALL d * write(file pipes[1], some data, 


strlen(some data)]; 
printf('Wrote $d bytesin*, data processed); 


) 
exit(EXIT SUCCESS); 
) 


运行 这 个 程序 时 ， 输 出 结果 和 前 例 一 样 : 


$ ./pipe2 
Wrote 3 bytes 
Read 3 bytes: 






行 这 个 程序 的 时 候 发 现 ， 命 令 提示 符 在 输出 结果 的 最 后 一 行 之 前 出 现 ， 为 了 便 


这 个 程序 首先 用 pipe 调 用 创建 一 个 管道 ， 接 着 用 fork 调 用 创建 一 个 新 进程 。 如 果 fork 调 用 成 功 ， 
父 进程 就 写 数据 到 管道 中 ， 而 子 进程 从 管道 中 读 取 数 据 。 父 子 进程 都 在 只 调用 了 一 次 write 或 reaa 之 
后 就 退出 。 如 果 父 进程 在 子 进程 之 前 退出 ， 你 就 会 在 两 部 分 输出 内 容 之 间 看 到 shell 提 示 符 。 

虽然 从 表面 上 看 ， 这 个 程序 和 第 一 个 使 用 管道 的 例子 很 相似 ， 但 实际 上 在 这 个 例子 中 我 们 往 前 跨 
出 了 一 大 步 ， 我 们 可 以 在 不 同 的 进程 之 间 进 行 读 写 操作 了 ， 如 图 13-2 所 示 。 





file pipes[1] file pipes[0] 

















13.5” 父 进程 和 子 进程 


在 接 下 来 的 对 pipe 调 用 的 研究 中 , 我 们 将 学 习 如 何在 子 进程 中 运行 一 个 与 其 父 进 程 完全 不 同 的 另 
外 一 个 程序 ， 而 不 是 仅仅 运行 一 个 相同 程序 。 我 们 用 exec 调 用 来 完成 这 一 工作 。 这 里 的 一 个 难点 是 ， 
通过 exec 调 用 的 进程 需要 知道 应 该 访问 哪个 文件 描述 符 。 在 前 面 的 例子 中 ， 因 为 子 进程 本 身 有 


452 第 13 章 进程 间 通 信 : 管道 





file_pipes 数 据 的 一 份 副本 ， 所 以 这 并 不 成 为 问题 。 但 经 过 exec 调 用 后 ， 情 况 就 不 一 样 了 ， 因 为 原 
先 的 进程 已 经 被 新 的 子 进程 替换 了 。 为 解决 这 个 问题 ， 我 们 可 以 将 文件 描述 符 它 实际 上 只 是 一 个 数 
30 作为 一 个 参数 传递 给 用 exec 启 动 的 程序 。 

为 了 演示 它 是 如 何 工作 的 ， 我 们 需要 使 用 两 个 程序 。 第 一 个 程序 是 数据 生产 者 ， 它 负责 创建 管道 
和 启动 子 进程 ， 而 后 者 是 数据 消费 者 。 


EE 管道 和 exec 函 数 


(D 下 面 这 个 程序 pipe3 .c 是 从 pipe2 .< 修改 而 来 。 我 们 在 改动 的 地 方 加 上 了 阴影 ， 如 下 所 示 ， 
#include <unistd.h> 
#include <stdlib.h> 
#include <stdio.h> 
#include <string.h> 


int main() 
( 


int data processed; 

int file pipes[2]; 

const char some data[] = *123*; 
Char buffer[BUFSIZ + 1]; 

pid t fork result; 


memset (buffer, 'X0', sizeof(buffer)); 


if (pipe(file pipes) == 0) ( 
fork result = fork( 
if (fork result == (pid t)-1) ( 
fprintf (stderr, "Fork failure"); 
exit (EXIT_FAILURE) ; 





) 


if (fork result == 0) ( 
sprintf (buf: "sd", file pipes[0]); 
(void)execl(*pipe4", "pipe4*, buffer, (char *)0); 
exit (EXIT_FAILURE) ; 





) 
else ( 
data processed - write(file pipes[1], some data, 
strlen(some data]); 
printf(*td - wrote &d bytes\n", getpid(), data processed); 
) 
) 
exit(EXIT SUCCESS); 
) 
(2) 数据 消费 者 程序 pipe4.c 负 责 读 取 数据 ， 它 的 代码 要 简单 得 多 ， 如 下 所 示 : 
#include «unistd.h» 
#include <stdlib.h> 
#include <stdio.h> 
#include <string.h> 
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int main(int argc, char *argv[]) 
M 
int data processed; 
Char buffer[BUFSIZ + 1]; 
int file descriptor; 


memset (buffer, '\0', sizeof(buffer)); 
sscanf(argv[1], "$d*, &file descriptor); 
data processed - read(file descriptor, buffer, BUFSIZ); 


printf('&d - read èd bytes: tsWn*, getpid(), data processed, buffer); 
exit(EXIT SUCCESS); 

) 

要 记 住 ，pipe3 在 程序 中 调用 pipe4， 运 行 pipe3 时 ， 我 们 将 看 到 如 下 所 示 的 输出 结果 : 

$ ./pipe3 

22460 - wrote 3 bytes 

22461 - read 3 bytes: 123 


pipe3 程 序 的 开始 部 分 和 前 面 的 例子 一 样 ， 用 pipe 调 用 创建 一 个 管道 ， 然 后 用 fork 调 用 创建 一 个 a 
新 进程 。 接 下 来 ， 它 用 sprintf 把 读 取 管 道 数 据 的 文件 描述 符 保存 到 一 个 缓存 区 中 ， 该 缓存 区 中 的 内 
容 将 构成 pipe4 程 序 的 一 个 参数 。 

我 们 通过 execl 调 用 来 启动 pipe4 程 序 ，exec1 的 参数 如 下 所 示 。 

口 要 启动 的 程序 。 

O argv[0]: 程序 名 。 

口 argv[1]: 包含 我 们 想 让 被 调用 程序 去 读 取 的 文件 描述 符 。 

O (char *)0: 这 个 参数 的 作用 是 终止 被 调用 程序 的 参数 列表 。 

pipe4 程 序 从 参数 字符 串 中 提取 出 文件 描述 符 数字 ， 然 后 读 取 该 文件 描述 符 来 获取 数据 。 





13.5.1 管道 关闭 后 的 读 操作 


在 继续 学 习 之 前 ， 我 们 再 来 仔细 研究 一 下 打开 的 文件 描述 符 。 至 此 ， 我 们 一 直 采 取 的 是 让 读 进程 
读 取 一 些 数据 然后 直接 退出 的 方式 ， 并 假设 Linux 会 把 清理 文件 当 作 是 在 进程 结束 时 应 该 做 的 工作 的 
一 部 分 。 

但 大 多 数 从 标准 输入 读 取 数据 的 程序 采用 的 却 是 与 我 们 到 目前 为 止 见 到 的 例子 非常 不 同 的 另外 

-种 做 法 。 通 常 它们 并 不 知道 有 多 少数 据 需要 读 取 ， 所 以 往往 采用 循环 的 方法 ， 读 取 数 据 一 一 处 理 
数据 一 一 读 取 更 多 的 数据 ， 直 到 没有 数据 可 读 为 止 。 

当 没有 数据 可 读 时 ，read 调 用 通常 会 阻塞 ， 即 它 将 暂停 进程 来 等 待 直到 有 数据 到 达 为 止 。 如 果 管 
道 的 另 一 端 已 被 关闭 ， 也 就 是 说 ， 没 有 进程 打开 这 个 管道 并 向 它 写 数据 了 ， 这 时 read 调 用 就 会 阻塞 。 
但 这 样 的 阻塞 不 是 很 有 用 ， 因 此 对 一 个 已 关闭 写 数据 的 管道 做 reaq 调 用 将 返回 0 而 不 是 阻塞 。 这 就 使 
读 进程 能 够 像 检 测 文件 结束 一 样 ， 对 管道 进行 检测 并 作出 相应 的 动作 。 注意， 这 与 读 取 一 个 无 效 的 文 
件 描述 符 不 同 ，read 把 无 效 的 文件 描述 符 看 作 一 个 错误 并 返回 -1。 

如 果 跨 越 fork 调 用 使 用 管道 ， 就 会 有 两 个 不 同 的 文件 描述 符 可 以 用 于 向 管道 写 数据 ， 一 个 在 父 进 
程 中 ， 一 个 在 子 进 程 中 。 只 有 把 父子 进程 中 的 针对 管道 的 写 文件 描述 符 都 关闭 ， 管 道 才 会 被 认为 是 关 
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闭 了 ， 对 管道 的 reaq 调 用 才 会 失败 。 我 们 还 将 深入 讨论 这 一 问题 ， 在 学 习 到 o_NoNBLOcK 标 志和 FIFO 
时 ， 我 们 将 看 到 一 个 这 样 的 例子 。 


13.5.2 ”把 管道 用 作 标准 输入 和 标准 输出 


现在 ， 我 们 已 知道 了 如 何 使 得 对 一 个 空 管道 的 读 操作 失败 ， 下 面 我 们 来 看 一 种 用 管道 连接 两 个 进 
程 的 更 简洁 的 方法 。 我 们 把 其 中 一 个 管道 文件 描述 符 设置 为 一 个 已 知 值 ， 一 般 是 标准 输入 0 或 标准 输 
出 1。 在 父 进程 中 做 这 个 设置 稍微 有 点 复杂 ， 但 它 使 得 子 程序 的 编写 变 得 非常 简单 。 

这 样 做 的 最 大 好 处 是 我 们 可 以 调用 标准 程序 ， 即 那些 不 需要 以 文件 描述 符 为 参数 的 程序 。 为 了 完 
成 这 个 工作 ， 我 们 需要 使 用 在 第 3 章 中 介绍 过 的 dup 函数 。dup 函 数 有 两 个 紧密 关联 的 版 本 ， 它 们 的 原 
型 如 下 所 示 : 


#include <unistd.h> 


int dup(int file descriptor); 
int dup2(int file descriptor one, int file descriptor two); 


aup 调 用 的 目的 是 打开 一 个 新 的 文件 描述 符 ， 这 与 open 调 用 有 点 类 似 。 不 同 之 处 是 ，aup 调 用 创 
建 的 新 文件 描述 符 与 作为 它 的 参数 的 那个 已 有 文件 描述 符 指向 同一 个 文件 或 管道 ) 。 对 于 aup 函 数 
来 说 ， 新 的 文件 描述 符 总 是 取 最 小 的 可 用 值 。 而 对 于 aup2 函 数 来 说 ， 它 所 创建 的 新 文件 描述 符 或 者 与 
参数 file_descriptor_two 相 同 ， 或 者 是 第 一 个 大 于 该 参数 的 可 用 值 。 

我 们 可 以 使 用 更 通用 的 Ecnt1 调 用 ( command 参数 设置 为 F_DUPFD) 来 达到 与 调用 dup 和 

dup2 相 同 的 效果 。 虽然 如 此 ， 但 dup 调用 更 易于 使 用 ， 因 为 它 是 专门 用 于 复制 文件 描述 符 的 。 

而 且 它 的 使 用 非常 普遍 ， 你 可 以 发 现 ， 在 已 有 的 程序 中 ， 它 的 使 用 比 Ecnt1 和 F_DUPFD 更 频繁 . 

那么 , dup 是 如 何 帮 助 我 们 在 进程 之 间 传 递 数据 的 呢 ? 诀 穿 就 在 于 , 标准 输入 的 文件 描述 符 总 是 0， 
而 aup 返 回 的 新 的 文件 描述 符 又 总 是 使 用 最 小 可 用 的 数字 。 因此 ， 如 果 我 们 首先 关闭 文件 描述 符 0 然 后 
调用 aup， 那 么 新 的 文件 描述 符 就 将 是 数字 0。 因 为 新 的 文件 描述 符 是 复制 一 个 已 有 的 文件 描述 符 ， 所 
以 标准 输入 就 会 改 为 指向 一 个 我 们 传递 给 aup 函 数 的 文件 描述 符 所 对 应 的 文件 或 管道 。 我 们 创建 了 两 
个 文件 描述 符 ， 它 们 指向 同一 个 文件 或 管道 ， 而 且 其 中 之 一 是 标准 输入 。 

用 close 和 aup 函 数 对 文件 描述 符 进行 处 理 

理解 当 我 们 关闭 文件 描述 符 0， 然 后 调用 sup 究竟 发 生 了 什么 的 最 简单 的 方法 就 是 ， 查 看 开头 的 4 
个 文件 描述 符 的 状态 在 这 一 过 程 中 的 改变 情况 ， 如 表 13-1 所 示 。 











R 13-1 
文件 描述 符 LE 始 值 关闭 文件 描述 符 0 后 dup 调 用 后 
0 标准 输入 nm 管道 文件 描述 符 
1 标准 输出 标准 输出 标准 输出 
2 标准 错误 输出 标准 错误 输出 标准 错误 输出 
3 管道 文件 描述 符 管道 文件 描述 符 管道 文件 描述 符 





Ww 道 和 aup 函 数 


再 回 到 前 面 的 例子 ， 但 这 次 ， 我 们 将 把 子 程序 的 stain 文 件 描述 符 赫 换 为 我 们 创建 的 管道 的 读 取 
Mie 我 们 还 将 对 文件 描述 符 做 一 些 清理 ， 使 得 子 程序 可 以 正确 检测 到 管道 中 数据 的 结束 。 与 往常 一 样 ， 
为 了 简洁 起 见 ， 我 们 省 略 了 一 些 错误 检查 。 
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用 如 下 的 代码 将 pipe3 .c 修 改 为 pipe5.c: 
#include <unistd.h> 
#include <stdlib.h> 
#include <stdio.h> 
#include <string.h> 


int main() 
t 
int data processed; 
int file pipes[2]; 
const char some data[] = *123*; 
pid t fork result; 


if (pipe(file pipes) == 0) ( 
fork result - fork( 
if (fork result == (pid t)-1) ( 
fprintf (stderr, "Fork failure"); 
exit (EXIT_FAILURE) ; 





) 


if (fork result == (pid t)0) ( 
close(0); 
dup(file pipes[0]); 
close(file pipes[0]); 
close(file pipes[1]); 


execlp('od*, "od", *-c*, (char *)0); 

exit (EXIT_FAILURE) ; 

) 

else ( 
close(file pipes[0]); 
data processed - write(file pipes[1], some data, 

strlen (some_data) ); 

close(file_pipes[1]); 


printf("%d - wrote %d bytes n", (int)getpid(), data processed); 
) 


) 
exit(EXIT SUCCESS) ; 
$ 


这 个 程序 的 输出 结果 如 下 所 示 : 
$ ./pipe5 

22495 - wrote 3 bytes 
000000 1 2 3 
0000003 


与 往常 一 样 ， 这 个 程序 创建 一 个 管道 ， 然 后 通过 fork 创 建 一 个 子 进程 。 此 时 ， 父 子 进程 都 有 可 以 
访问 管道 的 文件 描述 符 ， 一 个 用 于 读数 据 ， 一 个 用 于 写 数 据 ， 所 以 总 共有 4 个 打开 的 文件 描述 符 。 
我 们 首先 来 看 子 进程 。 子 进程 先 用 close (0) 关 闭 它 的 标准 输入 ， 然 后 调用 Gup (file_pipes[0]) 
把 与 管道 的 读 取 端 关联 的 文件 描述 符 复制 为 文件 描述 符 0， 即 标准 输入 。 接 下 来 ， 子 进程 关闭 原先 的 
用 来 从 管道 读 取 数 据 的 文件 描述 符 file_pipes[0] 。 因 为 子 进程 不 会 向 管道 写 数 据 ， 所 以 它 把 与 管道 
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关联 的 写 操作 文件 描述 符 file_pipes[1] 也 关闭 了 。 现在， 它 只 有 一 个 与 管道 关联 的 文件 描述 符 ， 即 
文件 描述 符 0， 它 的 标准 输入 。 

接 下 来 ， 子 进程 就 可 以 用 exec 来 启动 任何 从 标准 输入 读 取 数据 的 程序 了 。 在 本 例 中 ,我们 使 用 的 
是 od 命令 。og 命 令 将 等 待 数据 的 到 来 ， 就 好 像 它 在 等 待 来 自用 户 终端 的 输入 一 样 。 事 实 上 ， 如 果 没有 
明确 使 用 检测 这 两 者 之 间 不 同 的 特殊 代码 ， 它 并 不 知道 输入 是 来 自 一 个 管道 ， 而 不 是 来 自 一 个 终端 。 

父 进程 首先 关闭 管道 的 读 取 端 file_pipes [0] ， 因 为 它 不 会 从 管道 读 取 数据 。 接 着 它 向 管道 写 入 
数据 。 当 所 有 数据 都 写 完 后 ， 父 进程 关闭 管道 的 写 入 端 并 退出 。 因 为 现在 已 没有 打开 的 文件 描述 符 可 
以 向 管道 写 数据 了 ，oad 程 序 读 取 写 到 管道 中 的 3 个 字 节 数 据 后， 后 续 的 读 操作 将 返回 0 字 节 ， 表 示 已 到 
达 文件 尾 。 当 读 操作 返回 0 时 ，oq 程 序 就 退出 运行 。 这 类 似 于 在 终端 上 运行 oa 命令 ， 然 后 按 下 Ctrl+D 
组 合 键 发 送 文件 尾 标志 。 

图 13-3 显 示 调用 pipe 之 后 的 情况 。 

管道 


进程 


图 13-4 显 示 调 用 fork 之 后 的 情况 。 





file pipest0] file pipest0] 


a Ei 


file pipes17 file pipest1] 























图 13-4 
图 13-5 显 示 程 序 做 好 数据 传输 准备 之 后 的 情况 。 








标准 输出 

















13.6 ”命名 管道 , FIFO 
至 此 ， 我 们 还 只 能 在 相关 的 程序 之 间 传 递 数据 ， 即 这 些 程序 是 由 一 个 共同 的 祖先 进程 启动 的 。 但 
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如 果 我 们 想 在 不 相关 的 进程 之 间 交 换 数据 ， 这 还 不 是 很 方便 。 

我 们 可 以 用 FIFO 文 件 来 完成 这 项 工作 ， 它 通常 也 被 称 为 命名 管道 (named pipe)。 命 名 管道 是 一 种 
特殊 类 型 的 文件 〈 别 忘 了 Linux 中 的 所 有 事物 都 是 文件 )， 它 在 文件 系统 中 以 文件 名 的 形式 存在 ， 但 它 
的 行为 却 和 我 们 已 经 见 过 的 没有 名 字 的 管道 类 似 。 

我 们 可 以 在 命令 行 上 创建 命名 管道 ， 也 可 以 在 程序 中 创建 它 。 过 去 ， 命 令 行 上 用 来 创建 命名 管道 
的 程序 是 mnod， 如 下 所 示 : 

$ mknod filename p 

但 mlenod 命 令 并 未 出 现在 X/Open 规 范 的 命令 列表 中 ,所 以 可 能 并 不 是 所 有 的 类 UNIX 系 统 都 可 以 这 
样 做 。 我 们 推荐 使 用 的 命令 行 命令 是 : 


$ mkfifo filename 


有 些 老 版 本 的 UNIX 系 统 只 有 mknoa 命 令 。X/Open 规 范 的 第 4 期 第 2 版 中 有 mkamnod 函 数 调 
用 ， 但 没有 对 应 的 命令 行程 序 。Linux 系 统 非常 友好 ， 它 同时 支持 mknod 和 mkfifo。 
在 程序 中 ， 我 们 可 以 使 用 两 个 不 同 的 函数 调用 ， 如 下 所 示 : 


#include <sys/types.h> 
#include <sys/stat.h> 


int mkfifo(const char *filename, mode t mode); 

int mknod(const char *filename, mode t mode | S IFIFO, (dev t) 0); 

与 mknoad 命 令 一 样 ， 我 们 可 以 用 mknod 函 数 建立 许多 特殊 类 型 的 文件 。 要 想 通过 这 个 函数 创建 一 
个 命名 管道 ， 唯 一 具有 可 移植 性 的 方法 是 使 用 一 个 aev_t 类 型 的 值 0， 并 将 文件 访问 模式 与 s_IFIFo 按 
位 或 。 我 们 在 下 面 的 例子 中 将 使 用 较 简单 的 mkfifo 函 数 。 


实验 创建 命名 管道 
下 面 是 程序 fifo1.c 的 代码 : 
#include <unistd.h> 
#include <stdlib.h> 
#include <stdio. 
finclude <sys/types.h> 
finclude <sys/stat.h> 





int main() 
t 


int res = mkfifo(*/tmp/my fifo*, 0777); 
if (res == 0) printf(*FIFO createdin'); 
exit(EXIT SUCCESS); 

Y 


我 们 可 以 用 下 面 的 命令 来 创建 和 查找 管道 : 

$ ./fifol 

FIFO created 

$ 1s -1P /tmp/my fifo 

prwxr-xr-x 1 rick users 0 2007-06-16 17:18 /tmp/my fifo| 


注意 ， 输 出 结果 中 的 第 一 个 字符 为 p， 表 示 这 是 一 个 管道 。 最 后 的 | 符号 是 由 1s 命 令 的 -F 选 项 添加 
的 ， 它 也 表示 这 是 一 个 管道 。 
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这 个 程序 用 mkfifo 函 数 创 建 一 个 特殊 的 文件 。 虽 然 我 们 要 求 的 文件 模式 是 0777， 但 它 被 用 户 掩 
fj (umask) 设置 (在 本 例 中 是 022) 给 改变 了 ， 这 与 普通 文件 的 创建 是 一 样 的 ， 所 以 文件 的 最 终 模式 
是 755。 如 果 你 的 掩 码 设置 与 这 里 不 同 ， 比 如 是 0002， 那 你 将 看 到 创建 的 文件 拥有 一 个 不 同 的 权限 。 

我 们 可 以 像 刷 除 一 个 普通 文件 那样 用 rm 命令 删除 FIFO 文 件 ， 或 者 也 可 以 在 程序 中 用 unlink 系 统 
调用 来 删除 它 。 








13.6.1 访问 FIFO 文件 


命名 管道 的 一 个 非常 有 用 的 特点 是 : 由 于 它们 出 现在 文件 系统 中 ， 所 以 它们 可 以 像 平常 的 文件 名 
一 样 在 命令 中 使 用 。 在 把 创建 的 FIFO 文 件 用 在 程序 设计 中 之 前 ， 我 们 先 通过 普通 的 文件 命令 来 观察 
FIFO 文 件 的 行为 。 


实验 访问 FIFO 文 件 

(1) 首先 ， 我 们 来 尝试 读 这 个 〈 空 的 ) FIFO 文 件 : 

$ cat < /tmp/my fifo 

(2) 现在 ， 尝 试 向 FIFO 写 数据 。 你 必须 用 另 一 个 终端 来 执行 下 面 的 命令 ， 因 为 第 一 个 命令 现在 被 
挂 起 以 等 待 数据 出 现在 FIFO 中 。 

$ echo "Hello World" > /tmp/my fifo 

你 将 看 到 cat 命 令 产生 输出 。 如 果 不 向 FIFO 发 送 任何 数据 ，cat 命 令 将 一 直 挂 起 ， 直 到 你 中 断 它 ， 
常用 的 中 断 方式 是 使 用 组 合 键 Ctri+C。 

(3) 我 们 可 以 将 第 一 个 命令 放 在 后 台 执行 ， 这 样 即 可 一 次 执行 两 个 命令 : 

$ cat < /tmp/my fifo & 

[1] 1316 


$ echo "Hello World" » /tmp/my fifo 
Hello World 


[1]* Done cat «/tmp/my fifo 


因为 FIFO 中 没有 数据 ， 所 以 cat 和 echo 程 序 都 阻塞 了 ，cat 等 待 数据 的 到 来 ， 而 echo 等 待 其 他 进 
程 读 取 数 据 。 

在 上 面 的 第 三 步 中 ，cat 进 程 一 开始 就 在 后 台 被 阻塞 了 ， 当 echo 向 它 提供 了 一 些 数据 后 ，cat 命 
令 读 取 这 些 数据 并 把 它们 打印 到 标准 输出 上 ， 然 后 cat 程 序 退 出 ， 不 再 等 待 更 多 的 数据 。 它 没有 阻塞 
是 因为 当 第 二 个 命令 将 数据 放 入 FIFO 后 ， 管 道 将 被 关闭 ， 所 以 cat 程 序 中 的 reaa 调 用 返回 0 字 节 ， 表 
示 已 经 到 达 文件 尾 。 

现在 我 们 已 看 过 用 命令 行程 序 访问 FIFO 的 情况 , 接 下 来 我 们 将 仔细 分 析 FIFO 的 编程 接口 ， 它 可 以 
让 我 们 在 访问 FIFO 文 件 时 更 多 地 控制 其 读 写 行为 

与 通过 pipe 调 用 创建 管道 不 同 ,FIFO 是 以 命名 文件 的 形式 存在 ， 而 不 是 打开 的 文件 描述 
符 ， 所 以 在 对 它 进行 读 写 操作 之 前 必须 先 打开 它 。FIFO 也 用 open 和 close 函 数 打开 和 关闭 ， 
这 与 我 们 前 面 看 到 的 对 文件 的 操作 一 样 ,但 它 多 了 一 些 其 他 的 功能 .对 FIFO 来 说 ,传递 给 open 
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调用 的 是 FIFO 的 路 径 名 ， 而 不 是 一 个 正常 的 文件 . 





1. 使 用 open 打开 FIFO 文 件 

打开 FIFO 的 一 个 主要 限制 是 ， 程 序 不 能 以 o_RpwR 模 式 打开 FIFO 文 件 进行 读 写 操作 ， 这 样 做 的 后 
果 并 未 明确 定义 。 但 这 个 限制 是 有 道理 的 ， 因 为 我 们 通常 使 用 FIFO 只 是 为 了 单 向 传递 数据 ， 所 以 没有 
必要 使 用 o_RDwR 模 式 。 如 果 一 个 管道 以 读 / 写 方式 打开 ， 进 程 就 会 从 这 个 管道 读 回 它 自己 的 输出 。 

如 果 确 实 需 要 在 程序 之 间 双 向 传递 数据 , 最 好 使 用 一 对 FIFO 或 管道 , 一 个 方向 使 用 一 个 , 或 者 (但 
并 不 常用 ) 采用 先 关闭 再 重新 打开 FIFO 的 方法 来 明确 地 改变 数据 流 的 方向 。 我 们 将 在 本 章 后 面部 分 再 
讨论 用 FIFO 进 行 双向 数据 交换 的 问题 。 

打开 FIFO 文 件 和 打开 普通 文件 的 另 一 点 区 别 是 ， 对 open_flag (open 函 数 的 第 二 个 参数 ) 的 
O_NONBLOCK 选 项 的 用 法 。 使 用 这 个 选项 不 仅 改变 open 调 用 的 处 理 方式 ， 还 会 改变 对 这 次 open 调 用 返 
回 的 文件 描述 符 进行 的 读 写 请 求 的 处 理 方式 。 

0_RDONLY、0_WRONLY 和 0_NONBLOCK 标 志 共 有 4 种 合法 的 组 合 方式 ， 我 们 将 逐个 介绍 它们 。 

open(const char *path, O RDONLY); 

在 这 种 情况 下 ，open 调 用 将 阻塞 ， 除 非 有 一 个 进程 以 写 方式 打开 同一 个 FIFO， 否 则 它 不 会 返回 。 
这 与 前 面 第 一 个 cat 命 令 的 例子 类 似 。 

open(const char *path, O_RDONLY | O NONBLOCK); 

即使 没有 其 他 进程 以 写 方式 打开 FIFO， 这 个 open 调 用 也 将 成 功 并 立刻 返回 。 

open (const char *path, O WRONLY); 


在 这 种 情况 下 ，open 调 用 将 阻塞 ， 直 到 有 一 个 进程 以 读 方式 打开 同一 个 FIFO 为 止 。 
open(const char *path, O WRONLY | O NONBLOCK); 


这 个 函数 调用 总 是 立刻 返回 , 但 如 果 没有 进程 以 读 方式 打开 FIFO 文 件 ，open 调 用 将 返回 一 个 错误 
-1 并 且 FIFO 也 不 会 被 打开 。 如 果 确实 有 一 个 进程 以 读 方式 打开 FIFO 文 件 ,那么 我 们 就 可 以 通过 它 返 回 
的 文件 描述 符 对 这 个 FIFO 文 件 进行 写 操作 。 
请 注意 oO_NONBLOCK 分 别 搭配 0_RDONLY 和 O_WRONLY 在 效果 上 的 不 同 ， 如 果 没 有 进程 以 读 
方式 打开 管道 ， 非 阻塞 写 方 式 的 open 调 用 将 失败 ， 但 非 阻 塞 读 方式 的 open 调 用 总 是 成 功 . 
close 调 用 的 行为 并 不 受 0_NONBLOCK 标 志 的 影响 . 


* 打开 FIFO 文 件 


下 面 我 们 来 看 ， 如 何 通过 使 用 带 o_NONBLOcK 标 志 的 open 调 用 的 行为 来 同步 两 个 进程 。 我 们 在 这 
里 并 没有 选择 使 用 多 个 示例 程序 的 做 法 ， 而 是 只 使 用 一 个 测试 程序 fifo2.c， 通 过 给 该 程序 传递 不 同 
的 参数 的 方法 来 观察 FIFO 的 行为 。 

(1) 程序 的 开始 部 分 是 头 文件 和 #define 定 义 ， 然 后 检查 是 否 在 命令 行 提供 了 正确 数目 的 参数 : 

#include <unistd.h> 

#include <stdlib.h> 

#include <stdio.h> 

#include <string.h> 

finclude <fcntl.h> 

#include <sys/types.h> 
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#include «sys/stat.h» 
#define FIFO NAME */tmp/my fifo* 


int main(int argc, char *argv[]) 
t 

int res; 

int open mode - 0; 

int i; 


if (argc < 2) ( 
fprintf(stderr, "Usage: %s «some combination of\ 


O-RDONLY O WRONLY O NONBLOCK»1n*, *argv); 
exit(EXIT FAILURE); 


(2) 假设 程序 已 通过 测试 ， 现 在 我 们 根据 命令 行 参数 来 设置 open_mode 的 值 : 
forli = 1; i <argc; i++) ( 
if (strncmp(*e*argv, "O RDONLY*, 8) == 0) 
open mode |- O RDONLY; 
if (strncmp(*argv, "O WRONLY*, 8) == 0) 
open mode |= O WRONLY; 
if (strnemp(*argv, *O NONBLOCK*, 10) == 0) 
open mode |= O NONBLOCK; 
) 


(3) 现在 检查 FIFO 文 件 是 否 存在 ， 如 有 必要 就 创建 它 。 接 下 来 打开 这 个 FIFO 文 件 并 输出 相应 的 信 
息 ， 然 后 程序 小 禹 一 下 。 最 后 ， 关 闭 FIFO。 


if (access(FIFO NAME, F_OK) == -1) ( 
res = mkfifo(FIFO NAME, 0777); 
if (res !- 0) ( 
fprintf(stderr, "Could not create fifo ¢s\n", FIFO NAME); 
exit(EXIT FAILURE); 
Y 
) 


printf(*Process %d opening FIFOWn*, getpid()); 
res = open(FIFO NAME, open mode); 
printf(*Process %d result d\n", getpid(), res); 





printf('Process &d finishedin*, getpid()); 
exit(EXIT SUCCESS) ; 
) 
实验 解析 
这 个 程序 能 够 在 命令 行 上 指定 我 们 希望 使 用 的 o_RDONLY、o_WRONLY 和 o_NONBLOcK 的 组 合 方式 。 
它 会 把 命令 行 参数 与 程序 中 的 常量 字符 串 进 行 比较 ， 如 果 匹 配 ， 就 用 | = 操作 符 ) 设置 相应 的 标志 。 
程序 用 access 函 数 来 检查 FIFO 文 件 是 否 存在 ， 如 果 不 存在 就 创建 它 。 


在 程序 中 ， 一 直到 最 后 都 没有 删除 这 个 FIFO 文 件 ， 因 为 我 们 没 办 法 知道 是 否 有 其 他 程序 正在 使 
用 它 。 
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2. 不 带 0_NONBLOCK 标 志 的 0_RDONLY 和 0O_WRONLY 
我 们 现在 有 了 测试 程序 ， 可 以 逐个 尝试 标志 的 不 同 组 合 方式 。 注意 , 我 们 将 第 一 个 程序 ( 读 取 者 》 


放 在 后 台 运行 : 


$ ./fifo2 O RDONLY & 

[1] 152 

Process 152 opening FIFO 
$ ./fifo2 O WRONLY 
Process 153 opening FIFO 
Process 152 result 3 
Process 153 result 3 
Process 152 finished 
Process 153 finished 


这 可 能 是 命名 管道 最 常见 的 用 法 了 。 它 允许 先 启动 读 进程 ， 并 在 open 调 用 中 等 待 ， 当 第 二 个 程序 


打开 FIFO 文 件 时 ， 两 个 程序 继续 运行 。 注 意 ， 读 进程 和 写 进程 在 open 调 用 处 取得 同步 。 


当 一 个 Linux 进 程 被 阻塞 时 ， 它 并 不 消耗 CPU 资源 ， 所 以 这 种 进程 的 同步 方式 对 CPU 来 说 
是 非常 有 效率 的 。 


3. 带 0_NONBLOCK 标 志 的 0_RDONLY 和 不 带 该 标志 的 0_WRONLY 
这 次 ， 读 进程 执行 open 调 用 并 立刻 继续 执行 ， 即 使 没有 写 进程 的 存在 。 随 后 写 进程 开始 执行 ， 它 


也 在 执行 open 调 用 后 立刻 继续 执行 ， 但 这 次 是 因为 FIFO 已 被 读 进程 打开 。 


式 。 


$ ./fifo2 O RDONLY O NONBLOCK & 

[1] 160 

Process 160 opening FIFO 

$ ./fifo2 O WRONLY 

Process 161 opening FIFO 

Process 160 result 3 

Process 161 result 3 

Process 160 finished 

Process 161 finished 

[1]+ Done -/fifo2 O RDONLY O. NONBLOCK 


这 两 个 例子 可 能 是 open 模 式 的 最 常见 的 组 合 形式 。 你 还 可 以 用 这 个 示例 程序 随意 尝试 其 他 组 合 方 


4. 对 FIFO 进 行 读 写 操作 
使 用 0_NONBLOCK 模 式 会 影响 到 对 FIFO 的 read 和 write 调 用 。 
对 一 个 空 的 、 阻 塞 的 FIFO〈 即 没有 用 o_NOoNBLOCcK 标 志 打 开 ) 的 read 调 用 将 等 待 ， 直 到 有 数据 可 


以 读 时 才 继续 执行 。 与 此 相反 ， 对 一 个 空 的 、 非 阻塞 的 FIFO 的 read 调 用 将 立刻 返回 0 字 节 。 


对 一 个 完全 阻塞 FIFO 的 write 调用 将 等 待 ， 直 到 数据 可 以 被 写 入 时 才 继 续 执行 。 如 果 FIFO 不 能 接 


收 所 有 写 入 的 数据 "， 它 将 按 下 面 的 规则 执行 。 


口 如 果 请 求 写 入 的 数据 的 长 度 小 于 等 于 PTPE_BUF 字 节 ， 调 用 失败 ， 数 据 不 能 写 入 。 

O 如 果 请 求 写 入 的 数据 的 长 度 大 于 PTPE_BUF 字 节 ， 将 写 入 部 分 数据 ， 返 回 实际 写 入 的 字 节 数 ， 
返回 值 也 可 能 是 0。 

FIFO 的 长 度 是 需要 考虑 的 一 个 很 重要 的 因素 .系统 对 任 一 时 刻 在 一 个 FIFO 中 可 以 存在 的 数据 长 度 


是 有 限制 的 。 它 由 #define PIPE_BUF 语 名 定义， 通常 可 以 在 头 文件 limits.h 中 找到 它 。 在 Linux 和 许 


@ 这 里 所 指 的 情况 是 当 FIFO 被 设置 为 非 阻塞 模式 时 。 一 一 译 者 注 
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多 其 他 类 UNIX 系 统 中 ， 它 的 值 通 常 是 4 096 字 节 ， 但 在 某 些 系统 中 它 可 能 会 小 到 512 字 节 。 系 统 规 定 : 
在 一 个 以 o_wRoNLY 方 式 〈 即 阻塞 方式 打开 的 FIFO 中 ， 如 果 写 入 的 数据 长 度 小 于 等 于 PIPE_BUF， 那 
么 或 者 写 入 全 部 字 节 ， 或 者 一 个 字 节 都 不 写 入 。 

虽然 , 对 只 有 一 个 FIFO 写 进程 和 一 个 FIFO 读 进程 的 简单 情况 来 说 ,这 个 限制 并 不 是 非常 重要 , 但 
只 使 用 一 个 FIFO 并 允许 多 个 不 同 的 程序 向 一 个 FIFO 读 进程 发 送 请 求 的 情况 是 很 常见 的 。 如 果 几 个 不 同 
的 程序 尝试 同时 向 FIFO 写 数据 , 能 否 保证 来 自 不 同 程序 的 数据 块 不 相互 交错 就 非常 关键 了 。 也 就 是 说 ， 
每 个 写 操作 都 必须 是 “原子 化 ”的 。 怎 样 才能 做 到 这 一 点 呢 ? 

如 果 你 能 保证 所 有 的 写 请 求 是 发 往 一 个 阻塞 的 FIFO 的 ， 并 且 每 个 写 请 求 的 数据 长 度 小 于 等 于 
PIPE_BUF 字 节 ， 系 统 就 可 以 确保 数据 决 不 会 交错 在 一 起 。 通 常 将 每 次 通过 FIFO 传 递 的 数据 长 度 限 制 
为 PIPE_BUF 字 节 是 个 好 方法 ， 除 非 你 只 使 用 一 个 写 进程 和 一 个 读 进程 。 


实验 使 用 FIFO 实 现 进程 间 通 信 


为 了 演示 不 相关 的 进程 是 如 何 使 用 命名 管道 进行 通信 的 ， 我 们 需要 用 到 两 个 独立 的 程序 fifo3 ,c 
和 fifo4.c。 
(1) 第 一 个 程序 是 生产 者 程序 。 它 在 需要 时 创建 管道 ， 然 后 尽 可 能 快 地 向 管道 中 写 入 数据 。 


注意 ， 出 于 演示 的 目的 ， 我 们 并 不 关心 写 入 数据 的 内 容 ， 所 以 我 们 并 未 对 缓冲 区 进行 初 
始 化 .在 这 两 个 程序 代码 中 ， 与 fifo2.c 不 一 样 的 地 方 都 加 上 了 阴影 ， 处 理 命令 行 参 数 的 代 
BERT. 


finclude <unistd.h> 
include <stdlib.h> 
include <stdio.h> 
include <string.h> 
#include -fcntl.h» 
#include «limits.h» 
#include <sys/types.h> 
#include <sys/stat.h> 


#define FIFO NAME "/tmp/my_fifo" 
#define BUFFER_SIZE PIPE_BUF 
#define TEN_MEG (1024 * 1024 * 10) 


int main() 
t 
int pipe fd; 
int res; 
int open mode - O WRONLY; 
int bytes sent = 0; 
Char buffer[BUFFER SIZE + 1]; 


if (access(FIFO NAME, F OK) == -1) ( 
res = mkfifo(FIFO NAME, 0777); 
if (res != 0) ( 
fprintf (stderr, "Could not create fifo %s\n", FIFO NAME); 
exit(EXIT FAILURE); 
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printf(*Process $d opening FIFO O_WRONLY\n", getpid()); 
pipe fd = open(FIFO NAME, open mode); 
printf(*Process $d result $din*, getpid(), pipe fd); 


if (pipe fd != -1) ( 
while(bytes sent < TEN MEG) { 
res = write(pipe fd, buffi 
if (res == -1) ( 
fprintf(stderr, "Write error on pipe\n"); 
exit(EXIT FAILURE); 





， BUFFER SIZE); 


) 
bytes sent += res; 
) 
(void)close (pipe fd); 
) 
else ( 
exit(EXIT FAILURE); 


printf(*Process %d finishedin', getpid()); 
exit(EXIT SUCCESS); 
) 


(2) 第 二 个 程序 是 消费 者 程序 ， 它 的 代码 要 简单 得 多 ， 它 从 FIFO 读 取 数 据 并 丢弃 它们 。 
#include <unistd.h> 

#include <stdlib.h> 

#include <stdio.h> 

#include <string.h> 

#include «fcntl.h» 

#include «limits.h» 

#include <sys/types.h> 

finclude «sys/stat.h» 


define FIFO NAME */tmp/my fifo* 
$define BUFFER SIZE PIPE_BUF 


int main() 

t 
int pipe fd; 
int res; 
int open mode - O RDONLY; 
Char buffer[BUFFER SIZE + 1]; 
int bytes read - 0; 


memset (buffer, '\0', sizeof(buffer)); 

printf(*'Process $d opening FIFO O_RDONLY\n", getpid()]; 
pipe fd = open(FIFO NAME, open mode]; 

printf(*Process $d result %d\n*, getpid(), pipe fd); 


if (pipe fd !- -1) ( 
do ( 
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res = read(pipe fd, buffer, BUFFER SIZE); 
bytes read += res; 
) while (res » 0); 
(void) close(pipe. fd) ; 
) 
else ( 
exit (EXIT_FAILURE) ; 
) 


printf('Process %d finished, &d bytes readin', getpid(), bytes read); 
exit(EXIT SUCCESS); 

) 

我 们 在 运行 这 两 个 程序 的 同时 ,用 time 命 令 对 读 进程 进行 计时 。 输出 结果 如 下 所 示 (为 简洁 起 见 ， 

对 结果 做 了 一 些 修改 ); 

$ ./fifo3 & 

[1] 375 

Process 375 opening FIFO O WRONLY 

$ time ./fifo4 

Process 377 opening FIFO O RDONLY 

Process 375 result 3 

Process 377 result 3 

Process 375 finished 

Process 377 finished, 10485760 bytes read 


real  0m0.053s 
user  0m0.020s 
sys 0m0.040s 


[1]* Done /fifo3 

实验 解析 

两 个 程序 使 用 的 都 是 阻塞 模式 的 FIFO。 我 们 首先 启动 fifo3( 写 进程 /生产 者 )， 它 将 阻塞 以 等 待 
读 进程 打开 这 个 FIFO。fifo4 (消费 者 ) 启动 以 后 ， 写 进程 解除 阻塞 并 开始 向 管道 写 数据 。 同 时 ， 读 
进程 也 开始 从 管道 中 读 取 数据 。 

Linux 会 安排 好 这 两 个 进程 之 间 的 调度 ， 使 它们 在 可 以 运行 的 时 候 运行 ， 在 不 能 运行 的 时 

候 阻 塞 。 因 此， 写 进程 将 在 管道 满 时 阻塞 ， 读 进程 将 在 管道 空 时 阻塞 . 

time 命 令 的 输出 显示 , 读 进程 只 运行 了 不 到 0.1 秒 的 时 间 , 却 读 取 了 10 MB 的 数据 。 这 说 明 管道 (至 
少 在 现代 Linux 系 统 中 的 实现 ) 在 程序 之 间 传 递 数据 是 很 有 效率 的 。 





13.6.2 ”高 级 主题 : 使 用 FIFO 的 客户 /服务 器 应 用 程序 


作为 学 习 FIFO 的 最 后 一 部 分 内 容 ， 我 们 来 考虑 怎样 通过 命名 管道 来 编写 一 个 非常 简单 的 客户 / 服 
务 器 应 用 程序 。 我 们 想 只 用 一 个 服务 器 进程 来 接受 请 求 ， 对 它们 进行 处 理 ， 最 后 把 结果 数据 返回 给 发 
送 请 求 的 一 方 : 客户 。 

我 们 想 允 许多 个 客户 进程 都 可 以 向 服务 器 发 送 数据 。 为 了 使 问题 简单 化 ， 我 们 假设 被 处 理 的 数据 
可 以 被 拆 分 为 一 个 个 数据 块 ， 每 个 的 长 度 都 小 于 PTPE_BUF 字 节 。 当然, 我们 可 以 用 很 多 方法 来 实现 这 
个 系统 ， 但 在 这 里 我 们 只 考虑 一 种 方法 ， 即 可 以 体现 如 何 使 用 命名 管道 的 方法 。 


13.6 命名 管道 : FIFO — 465 





因为 服务 器 每 次 只 能 处 理 一 个 数据 块 , 所 以 只 使 用 一 个 FIFO 应 该 是 合乎 逻辑 的 ， 服 务 器 通过 它 读 
取 数 据 , 每 个 客户 向 它 写 数据 。 只 要 将 FIFO 以 阻塞 模式 打开 , 服务 器 和 客户 就 会 根据 需要 自动 被 阻塞 。 

将 处 理 后 的 数据 返回 给 客户 稍微 有 些 困难 。 我 们 需要 为 每 个 客户 安排 第 二 个 管道 来 接收 返回 的 数 
据 。 通 过 在 传递 给 服务 器 的 原先 数据 中 加 上 客户 的 进程 标识 符 〔PID)， 双 方 就 可 以 使 用 它 来 为 返回 数 
据 的 管道 生成 一 个 唯一 的 名 字 。 


E 一 个 客户 /服务 器 应 用 程序 的 例子 


(D) 首先 ， 我 们 需要 一 个 头 文件 client .h， 它 定义 了 客户 和 服务 器 程序 都 会 用 到 的 数据 。 为 了 方 
便 使 用 ， 它 还 包含 了 必要 的 系统 头 文件 。 

#include <unistd.h> 

#include <stdlib.h> 

#include <stdio.h> 

finclude <string.h> 

finclude «fcntl.h» 

finclude «limits.h» 

#include «sys/types.h» 

#include «sys/stat.h» 


define SERVER FIFO NAME "/tmp/serv fifo* 
#define CLIENT FIFO NAME "/tmp/cli &d fifo" 


(define BUFFER SIZE 20 


struct data to pass st ( 
pid t client pid; 
Char some data[BUFFER SIZE - 1]; 

Q) 现在 是 服务 器 程序 server.c。 在 这 一 部 分 ， 我 们 创建 并 打开 服务 器 管道 。 它 被 设置 为 只 读 的 
阻塞 模式 。 在 稍 作 休息 (这 是 出 于 演示 的 目的 ) 之 后 ， 服 务 器 开始 读 取 客 户 发 送 来 的 数据 ， 这 些 数据 
采用 的 是 data_to_pass_st 结 构 。 

#include "client,h" 

#include <ctype.h> 





int main() 
t 
int server fifo fd, client fifo fd; 
struct data to pass st my data; 
int read res; 
char client. fifo[256]; 
char *tmp char ptr; 


mkfifo(SERVER FIFO NAME, 0777); 
server fifo fd - open(SERVER FIFO NAME, O RDONLY); 
if (server fifo fd 1) í 

fprintf (stderr. rver fifo failure\n"); 

exit (EXIT_FAILURE) ; 
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) 
Sleep(10); /* lets clients queue for demo purposes */ 


do ( 
read res = read(server fifo fd, &my data, sizeof(my data)):; 
if (read res » 0) ( 


(3) 在 接 下 来 的 这 一 部 分 中 ,我 们 对 刚 从 客户 那里 读 到 的 数据 进行 处 理 , 把 some_aata 中 的 所 有 字 
符 全 部 转换 为 大 写 ， 并 且 把 cLIENT_FIFO_NAME 和 接收 到 的 client_pid 结 合 在 一 起 。 


tmp char ptr = my data.some data; 
while (*tmp char ptr) ( 
*tmp char ptr = toupper(*tmp char ptr); 
tmp char ptree; 
) 
sprintf(client fifo, CLIENT FIFO NAME, my data.client. pid); 


(4) 然后 ， 我 们 以 只 写 的 阻塞 模式 打开 客户 管道 ， 把 经 过 处 理 的 数据 发 送 回 去 。 最 后 ， 关 闭 服务 
器 管道 的 文件 描述 符 ， 删 除 FIFO 文 件 ， 退 出 程序 。 


client fifo fd = open(client fifo, O WRONLY); 
if (client fifo fd != -1) ( 
write(client fifo fd, &my data, sizeof(my data)); 
close(client. fifo fd); 
) 
) 
) while (read res » 0); 
close(server fifo fd); 
'unlink(SERVER, FIFO NAME); 
exit(EXIT SUCCESS); 
) 


(5) 下 面 是 客户 程序 client .c。 这 个 程序 的 第 一 部 分 先 检查 服务 器 FIFO 文 件 是 否 存 在 ， 如 果 存 在 
就 打开 它 。 然 后 它 获取 自己 的 进程 ID， 该 进程 ID 构 成 要 发 送 给 服务 器 的 数据 的 一 部 分 。 接 下 来 ， 它 创 
建 客户 FIFO， 为 下 一 部 分 内 容 做 好 准备 。 


#include "client.h" 
#include <ctype.h> 








int main() 

t 
int server fifo fd, client fifo fd; 
struct data to pass st my data; 
int times to send; 
char client. fifo[256]; 


server fifo fd - open(SERVER FIFO NAME, O WRONLY); 
if (server fifo fd == -1) ( 
fprintf (stderr, "Sorry, no serverin*); 
exit(EXIT FAILURE); 
) 


my data.client pid = getpid(); 


13.6_ 命 名 管道 : FIFO — 467 





sprintf(client fifo, CLIENT FIFO NAME, my data.client pid); 
if (mkfifo(client fifo, 0777) -- -1) ( 
fprintf(stderr, "Sorry, can't make s\n", client fifo); 
exit(EXIT FAILURE); 
) 


(6) 这 部 分 有 5 次 循环 ， 在 每 次 循环 中 ， 客 户 将 数据 发 送 给 服务 器 ， 然 后 打开 客户 FIFO〈 只 读 ， 阻 
塞 模式 ) 并 读 回 数据 。 在 程序 的 最 后 ， 关 闭 服务 器 FIFO 并 将 客户 FIFO 从 文件 系统 中 删除 。 


for (times to send = 0; times to send < 5; times_to_send++) ( 

sprintf(my data.some data, “Hello from d", my data.client pid); 
printf('&d sent $s, ", my data.client pid, my data.some data); 
write(server fifo fd, &my data, sizeof(my data)); 
client fifo fd - client fifo, O RDONLY); 
if (client fifo fd != -1) ( 

if (read(client fifo fd, &my data, sizeof(my data)) » 0) ( 

printf(*received: $s|n*, my data.some data); 











) 
close(client, fifo fd); 
H 
) 
close (server. fifo fd); 
unlink(client, fifo); 
exit(EXIT. SUCCESS) ; 
Y 
测试 这 个 程序 时 ， 我 们 需要 运行 一 个 服务 器 程序 和 多 个 客户 程序 。 为 了 让 多 个 客户 程序 尽 可 能 在 
同一 时 间 启 动 ， 我 们 使 用 如 下 所 示 的 shell 命 令 : 
$ ./server & 
$foriin12345 
do 
./client & 
done 


$ 
上 述 命令 启动 了 一 个 服务 器 进程 和 5 个 客户 进程 。 客 户 的 输出 如 下 所 示 〈 为 了 简洁 起 见 ， 我 们 做 
了 一 些 修改 ): 

531 sent Hello from 531, received: HELLO FROM 531 

532 sent Hello from 532, received: HELLO FROM 532 

529 sent Hello from 529, received: HELLO FROM 529 

530 sent Hello from 530, received: HELLO FROM 530 

531 sent Hello from 531, received: HELLO FROM 531 

532 sent Hello from 532, received: HELLO FROM 532 


如 你 所 见 , 不 同 的 客户 请 求 交 错 在 一 起 , 但 每 个 客户 都 获得 了 正确 的 服务 器 返回 给 它 的 处 理 数据 。 
要 注意 的 是 客户 请 求 的 交错 顺序 是 随机 的 ， 服 务 器 接收 到 客户 请 求 的 顺序 随机 器 的 不 同 而 不 同 ， 即 使 
是 在 同一 台 机 器 上 ， 每 次 运行 的 情况 也 可 能 发 生变 化 。 

EXLIJ 

现在 ， 我 们 将 解释 客户 和 服务 器 在 交互 时 各 种 操作 的 执行 顺序 ， 这 是 我 们 以 前 未 涉及 的 。 

服务 器 以 只 读 模式 创建 它 的 FIFO 并 阻塞 , 直到 第 一 个 客户 以 写 方式 打开 同一 个 FIFO 来 建立 连接 为 
止 。 此 时 ， 服 务 器 进程 解除 阻塞 并 执行 sleep 语 句 ， 这 使 得 来 自 客户 的 数据 排队 等 候 。 在 实际 的 应 用 
程序 中 ， 应 该 把 sleep 语 句 删除 。 我 们 在 这 里 使 用 它 只 是 为 了 演示 当 有 多 个 客户 的 请 求 同 时 到 达 时 ， 
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程序 的 正确 操作 方法 。 

与 此 同时 ， 在 客户 打开 了 服务 器 FIFO 后 ， 它 创建 自己 唯一 的 一 个 命名 管道 来 读 取 服 务 器 返回 的 数 
据 。 完 成 这 些 工 作 后 ， 客 户 发 送 数据 给 服务 器 〈 如 果 管 道 满 或 服务 器 仍 在 休眠 中 就 阻塞 )， 然 后 阻塞 
在 对 自己 的 FIFO 的 read 调 用 上 ， 等 待 服务 器 的 响应 。 

接收 到 来 自 客户 的 数据 后 ， 服 务 器 处 理 它 ， 然 后 以 写 方式 打开 客户 管道 并 将 处 理 后 的 数据 返回 ， 
这 将 解除 客户 的 阻塞 状态 。 客 户 被 解除 阻塞 后 ， 它 即 可 从 自己 的 管道 中 读 取 服务 器 返回 的 数据 。 

整个 处 理 过 程 不 断 重复 ， 直到 最 后 一 个 客户 关闭 服务 器 管道 为 止 ， 这 将 使 服务 器 的 reaa 调 用 失败 
(返回 90)， 因 为 已 经 没有 进程 以 写 方式 打开 服务 器 管道 了 。 如 果 这 是 一 个 真正 的 服务 器 进程 ， 它 还 需 
要 继续 等 待 客户 的 请 求 ， 我 们 就 需要 对 它 进行 修改 ， 有 两 种 方法 ， 如 下 所 示 。 

O 对 它 自 己 的 服务 器 管道 打开 一 个 文件 描述 符 ， 这 样 reaa 调 用 将 总 是 阻塞 而 不 是 返回 0。 

O 当 read 调 用 返回 时， 关闭 并 重新 打开 服务 器 管道 ， 使 服务 器 进程 阻塞 在 open 调 用 处 以 等 待 客 

户 的 到 来 ， 就 像 它 最 初 启动 时 那样 。 
在 用 命名 管道 重 写 的 CD 数据 库 应 用 程序 中 ， 我 们 将 向 读者 演示 这 两 个 技巧 。 





13.7 CD 数据 库 应 用 程序 


在 看 过 如 何 用 命名 管道 来 实现 一 个 简单 的 客户 /服务 器 系统 后 ， 我 们 将 重新 阅读 CD 数据 库 应 用 程 
序 ， 并 据 此 对 它 进行 改进 。 我 们 还 将 添加 一 些 信 号 处 理 内 容 ， 使 我 们 可 以 在 进程 被 中 断 时 执行 一 些 清 
- 作 。 为 了 使 代码 尽 可 能 简单 ， 我 们 将 使 用 早期 的 只 有 一 个 命令 行 接口 的 Gbm 版 本 。 

在 深入 研究 这 个 新 版 本 之 前 ， 先 来 编译 这 个 新 的 应 用 程序 。 如 果 你 已 经 从 网 站 上 下 载 了 源 代码 ， 
就 可 以 用 makefile 将 它 编译 为 server 和 client 这 两 个 程序 。 

第 7 章 讲 过 ， 不 同 的 Linux 发 行 版 命名 和 安装 dbm 文 件 的 方式 略微 不 同 。 如 果 我 们 提供 的 

文件 不 能 在 你 的 系统 中 成 功 编译 ， 请 回顾 第 7 章 有 关 dbm 文 件 命名 和 位 置 的 内 容 . 

键入 命令 server -i， 将 使 程序 初始 化 一 个 新 的 CD 数据 库 。 

不 用 说 ， 如 果 服 务 器 未 启动 运行 ， 客 户 程序 是 不 会 运行 的 。 下 面 是 makefile 文 件 的 内 容 ， 它 显示 
了 程序 是 如 何 组 织 在 一 起 的 : 


all: server client 








CCsec 
CFLAGS- -pedantic -Wall 


# For debugging un-comment the next line 
* DFLAGS--DDEBUG TRACE-1 -g 


* Where, and which version, of dbm are we using. 

# This assumes gdbm is pre-installed in a standard place, but we are 

* going to use the gdbm compatibility routines, that make it emulate ndbm. 
* We do this because ndbm is the 'most standard' of the dbm versions. 

# Depending on your distribution, these may need changing. 

DBM. INC. PATH-/usr/include/gdbm 

DBM. LIB PATH-/usr/lib 

DBM LIB FILE--lgdbm 

# On some distributions you may need to change the above line to include 
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# the compatibility library, as shown below. 
# DEM LIB FILE--lgdbm compat -lgdbm 


‘6.0: 
$(CC) $(CFLAGS) -I$(DBM_INC_PATH) $(DFLAGS) -c $< 





ipe imp.c cd data.h cliserv. h 
server. rver.c cd data.h cliserv.h 


client: app ui.o clientif.o pipe imp.o 
$(CC) -o client $(DFLAGS) app ui.o clientif.o pipe imp.o 


server: server.o cd dbm.o pipe imp.o 
$(CC) -o server -L$(DBM LIB PATH) $(DFLAGS) server.o cd dbm.o pipe imp.o - 
1$(DBM LIB FILE) 


clean: 
rm -f server client app *.o *- 


13.74 目标 


我 们 的 目标 是 把 这 个 应 用 程序 中 处 理 数据 库 的 部 分 和 用 户 界面 部 分 分 开 。 我 们 还 希望 只 运行 一 个 
服务 器 进程 ， 但 允许 存在 许多 并 发 的 客户 进程 。 我 们 将 尽量 减少 对 已 有 代码 的 修改 ， 只 要 有 可 能 ， 就 
保留 原 有 的 代码 。 

为 了 简化 应 用 ， 我 们 还 希望 能 够 在 应 用 程序 中 创建 《和 删除 ) 管道 ， 这 样 就 无 需 让 系统 管理 员 在 
运行 程序 之 前 为 我 们 创建 命名 管道 了 。 

还 有 一 点 非常 重要 ， 就 是 我 们 决 不 能 “ 忙 等 待 ” 某 个 事件 的 发 生 ， 从 而 减少 CPU 时 间 的 浪费 。 正 
如 我 们 看 到 的 ，Linux 允 许 我 们 阻塞 以 等 待 事件 的 发 生 ， 从 而 避免 消耗 很 多 系统 资源 。 我 们 可 以 利用 管 
道 的 阻塞 特性 来 确保 对 CPU 的 有 效 使 用 。 总 之 ， 服 务 器 至 少 在 理论 上 可 以 在 客户 请 求 到 来 之 前 等 待 许 
多 个 小 时 。 


13.7.2 实现 


在 第 7 章 这 个 应 用 程序 的 早期 单 进程 版 本 中 ， 我 们 用 一 组 数据 访问 例 程 来 处 理 数据 ， 它 们 是 : 


int database initialize(const int new database); 
void database close(void); 
Cdc. entry get cdc entry(const char *cd catalog ptr); 
cdt entry get cdt entry(const char *cd catalog ptr, const int track no); 
int add cdc entry(const các entry entry to add); 
int add cdt entry(const cát entry entry to add); 
int del cdc entry(const char *cd catalog ptr); 
int del cdt entry(const char *cd catalog ptr, const int track no); 
Cdc entry search cdc entry(const char *cd catalog ptr, 
int *first call ptr); 





这 些 函数 提供 了 一 个 方便 的 起 点 ， 让 我 们 可 以 把 客户 和 服务 器 两 部 分 清楚 地 分 开 。 
这 个 应 用 程序 的 单 进程 实现 版 本 虽然 被 编译 为 一 个 单独 的 程序 ， 但 我 们 可 以 把 它 看 作 是 由 两 部 分 
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组 成 的 ， 如 图 13-6 所 示 。 








数据 访问 例 程 























图 13-6 


在 客户 /服务 器 实现 版 本 中 , 我 们 想 在 这 个 应 用 程序 的 两 个 主要 部 分 之 间 插 入 一 些 命名 管道 和 相应 
的 支持 代码 。 图 13-7 显 示 了 我 们 需要 的 结构 。 

在 具体 实现 中 ， 我 们 选择 把 客户 和 服务 器 的 接口 例 程 都 放 在 同一 个 文件 pipe_imp.c 中 。 这 就 把 
在 客户 /服务 器 实现 版 本 中 依赖 命名 管道 使 用 的 所 有 代码 都 集中 到 一 个 文件 中 .而 将 传递 数据 的 格式 和 
打包 方式 与 实现 命名 管道 的 例 程 分 离开 。 新 版 本 中 所 包含 的 源 文件 更 多 了 ， 但 它们 之 间 的 区 分 也 更 符 
合 逻 辑 了 。 这 个 应 用 程序 的 调用 结构 如 图 13-8 所 示 。 
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文件 app_ui.c、client_if.c 和 pipe_imp.c 将 被 编译 和 链接 在 一 起 构成 客户 端 程序 。 而 文件 
cq_dbm.c、server.c 和 pipe_imp.c 将 被 编译 和 链接 在 一 起 构成 服务 器 程序 。 头 文件 cliserv.h 将 以 
一 个 公共 定义 头 文件 的 形式 把 这 两 者 联系 在 一 起 。 

文件 app_ui.c 和 ca_dbm.c 只 做 了 少许 改动 ， 主 要 是 为 了 把 它 分 离 为 两 个 程序 。 由 于 这 个 应 用 程 
序 现在 已 变 得 很 大 了 ， 而 代码 中 的 绝 大 部 分 和 以 前 的 版 本 相 比 并 无 改动 ， 所 以 我 们 在 这 里 只 显示 文件 
cliserv.h、client_if.c 和 pipe_imp.c 中 的 代码 。 


这 个 文件 的 菜 些 部 分 依赖 于 客户 /服务 器 的 具体 实现 ， 在 本 例 中 就 是 命名 管道 。 在 第 14 
章 的 结尾 ， 我 们 还 将 改 用 另 一 种 不 同 的 客户 /服务 器 模型 。 
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头 文件 cliserv.h 
我 们 首先 来 看 头 文件 cliserv.h。 这 个 文件 定义 了 客户 /服务 器 接口 。 客 户 和 服务 器 的 实现 中 都 要 
用 到 它 。 
(1) 首先 是 需要 包含 的 头 文件 : 
#include <unistd.h> 
#include <stdlib.h> 
#include «stdio.h» 
#include «fcntl.h» 
#include <limits.h> 
#include <sys/types.h> 
#include «sys/stat.h» 


(2) 接着 是 命名 管道 的 定义 。 我 们 为 服务 器 设置 一 个 管道 ， 为 每 个 客户 分 别 设置 一 个 管道 。 因 为 
可 能 会 有 多 个 客户 ， 所 以 客户 管道 的 名 字 中 要 加 上 它 的 进程 ID， 来 确保 管道 名 字 的 唯一 性 : 


#define SERVER PIPE "/tmp/server_pipe" 
#define CLIENT PIPE "/tmp/client $d pipe* 





(define ERR TEXT LEN 80 a 
(3) 我 们 将 命令 实现 为 枚 举 类 型 ， 而 不 是 #define 常 量 。 

使 用 枚 举 类 型 是 个 好 方法 ， 它 允许 编译 器 进行 更 多 的 类 型 检查 并 且 有 利于 软件 调试 因 
为 许多 调试 器 可 以 显示 枚 举 常量 的 名 字 ， 但 对 由 #define 指 令 定义 的 名 字 就 不 行 。 


第 一 个 typedef 给 出 了 发 送 给 服务 器 的 请 求 类 型 ,第 二 个 给 出 了 服务 器 返回 给 客户 的 响应 类 型 。 
typedef enum { 
s create new database = 0, 
s. get cdc entry, 
s get cdt entry, 
5. add, các. entry, 
add, cát. entry, 
del cdc entry, 
del cát. entry, 
s find cdc entry 
) client. request. e; 









typedef enum ( 
x.success = 0, 
r. failure, 
r find no more 
) server response e; 


(4) 接 下 来 ， 我 们 声明 了 一 个 结构 ， 用 来 在 两 个 进程 之 间 进行 双向 传递 消息 。 

因为 我 们 无 需 在 同一 个 响应 中 同时 返回 cdc_entry 和 cdt_entry， 所 以 也 可 以 用 联合 变 
量 的 形式 将 它们 结合 在 一 起 。 但 出 于 简化 问题 的 考虑 ， 我 们 还 是 将 它们 分 离开 来 ， 这 也 使 得 
代码 更 易于 维护 。 
typedef struct { 


pid t client pid; 
client request e ^ request; 
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Server response e response; 


cdc entry cdc entry data; 
cdt entry cát entry data; 
char error text[ERR TEXT LEN + 1]; 


) message db t; 


(5) 最 后 是 执行 数据 传输 工作 的 管道 接口 函数 ， 它 的 具体 实现 在 文件 pipe_imp.c 中 。 它 们 分 为 服 
务 器 端 函数 和 客户 端 函数 两 组 ， 分 别 列 在 下 面 的 第 一 部 分 和 第 二 部 分 : 


int server starting(void); 

void server. ending(void); 

int read request from client(message db t *rec ptr); 

int start resp to client(const message db t mess to send); 
int send resp to client(const message db t mess to send); 
void end resp to client (void); 





int client, starting(void); 

void client. ending(void); 

int send mess to server(message db t mess to send); 
int start resp from server(void); 

int read resp from server(message db t *rec ptr); 
void end resp from server (void); 


我 们 将 下 面 的 讨论 分 为 两 部 分 ， 一 部 分 介绍 客户 接口 函数 ， 另 一 部 分 介绍 在 文件 pipe_imp.c 中 
的 服务 器 端 和 客户 端 函数 的 实现 细节 ， 我 们 会 在 必要 时 给 出 源 代码 。 


13.7.3 客户 接口 函数 


现在 我 们 来 看 文件 client_if.c。 它 提供 了 “ 假 ”版 本 的 数据 库 访 问 例 程 。 这 些 例 程 对 请 求 进行 
编码 并 将 它 放 入 message_db_t 结 构 ， 然 后 使 用 pipe_imp.c 中 的 例 程 将 请 求 传输 给 服务 器 。 这 样 可 以 
尽量 减少 对 原来 的 app_ui .c 文 件 的 改动 。 

1. 客户 命令 解释 器 

(1) 这 个 文件 实现 了 在 头 文件 cd_aata.h 中 定义 的 9 个 数据 库 函数 。 它 的 作用 如 同 是 一 个 中 转 站 ， 
先 把 请 求 传递 给 服务 器 ， 然 后 从 函数 返回 服务 器 的 响应 。 它 的 开始 部 分 是 #include 语 句 和 常量 的 
定义 : 

#define _POSIX_SOURCE 


#include <unistd.h> 
#include <stdlib.h> 
#incluđe <stdio.h> 
#include «fcntl.h» 
#include <limits.h> 
#include <sys/types.h> 
#include «sys/stat.h» 


#include *cd data.h" 
#include *cliserv.h* 


(2) 静态 变量 mypid 减 少 了 对 getpid 函 数 的 调用 次 数 。 为 了 消除 重复 代码 ， 我 们 使 用 了 局 部 函数 


read one response: 
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static pid t mypid; 
static int read one response(message db t *rec ptr); 


(3) 函数 database_initialize 和 close 仍 被 使 用 , 但 与 以 往 不 同 , 它们 一 个 用 来 初始 化 管道 接口 
的 客户 端 ， 一 个 用 来 删除 当 客户 退出 时 多 余 的 命名 管道 : 


int database initialize(const int new database) 
t 

if (!client starting()) return(0); 

mypid = getpid(); 

return(1); 


) /* database initialize */ 


void database close(void) ( 
client, ending(); 
) 


(4) 用 一 个 给 定 的 CD 唱片 标题 调用 get_cac_entry 例 程 ， 将 从 数据 库 中 取出 对 应 的 标题 数据 项 。 
我 们 将 请 求 编码 到 一 个 message_ab_t 结 构 中 并 把 它 传递 给 服务 器 ， 然 后 将 服务 器 的 响应 读 回 到 另 一 
个 message_db_t 结 构 中 。 如 果 在 数据 库 中 找到 了 对 应 的 数据 项 ， 它 将 被 存放 在 message_db_t 结 构 的 
cdc_entry 结 构 中 ， 我 们 把 该 结构 作为 函数 的 返回 值 : 


Cdc entry get cdc entry(const char *cd catalog ptr) 
t 

cdc entry ret val; 

message db t mess send; 

message db t mess ret; 


ret val.catalog[0] = '\0'; 

mess send.client pid - mypid; 

mess send.request = s get các entry; 

strcpy(mess send.cdc entry data.catalog, cd catalog ptr); 





if (send mess to server(mess send)) ( 

if (read one response(&mess ret]) ( 
== r success) ( 
.cdc entry data; 





fprintf (stderr, 





, mess ret.error text]; 
) 
) else ( 
fprintf(stderr, "Server failed to respond\n"); 
} 
) eise ( 
fprintf(stderr, "Server not accepting requests|n*); 
) 
return(ret, val); 


j 
(5) 下 面 是 函数 read_one_response 的 源 代码 ， 我 们 用 它 来 避免 重复 代码 : 


static int read one response(message db t *rec ptr) ( 
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int return_code = 0; 
if (!rec ptr) return(0); 


if (start resp from server()) ( 

if (read resp from server(rec ptr)) ( 
return code = 1; 

} 
end resp from server(); 

} 

return (return_code); 

) 


(6) 其 他 get_yoxx、del_yox 和 adqd_yocx 形 式 的 例 程 与 get_cac_entry 函 数 的 实现 方式 类 似 。 为 了 
代码 的 完整 性 ， 我 们 也 把 它们 列 在 下 面 ， 首 先是 用 来 检索 CD 曲目 的 函数 get_cat_entry: 


Cdt entry get cdt entry(const char *cd catalog ptr, const int track no) 
t 
cdt entry ret. val; 
message db t me: 
message db t mess ret; 





ret val.catalog[0] = '\0'; 

mess, send.client pid = mypid; 

mes: jend, request = s get cdt entry; 

(mess. send.cdt entry data.catalog, cd catalog ptr); 
mess send.cdt entry data.track no = track no; 








if (send mess to server(mess send)) ( 
if (read one response(&mess ret)) ( 
if (mess ret.response == r success) ( 
ret val = mess ret.cdt entry data; 
) else ( 
fprintf(stderr, "%s", mess ret.error text); 





) 
) else ( 
fprintf(stderr, "Server failed to respondin'*); 
) 
) else ( 
fprintf(stderr, "Server not accepting requestsin*); 
) 
return(ret val); 


) 

(7) 接 下 来 是 两 个 添加 数据 的 函数 ， 第 一 个 用 于 标题 数据 库 ， 第 二 个 用 于 曲目 数据 库 : 
int add cdc entry(const cdc entry entry to add) 

t 


message db t mess send; 
message db t mess ret; 


mess send.client pid = mypid; 
mess send.request - s add cdc entry; 
mess send.cdc entry data - entry to add; 
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) 


if (send mess to server(mess send)) ( 
if (read one response(&mess ret)) ( 
if (mess ret.response -- r success) ( 
return(1); 
) else ( 


fprintf(stderr, "$s", mess ret.error text); 





) else ( 
fprintf(stderr, "Server failed to respond\n"); 


) else ( 
fprintf(stderr, "Server not accepting requests n'); 
} 
return(0); 
add cdt entry(const cdt entry entry to add) 


message db t mess send; 
message db t mess ret; 


iend.client pid = mypid; 
iend.request = s add cdt entry; 
nd.cdt entry data - entry to add; 






if (send mess to server(mess send)) ( 
if (read one response(&mess ret)) ( 
if (mess ret.response -- r succi 
return(1); 
) eise ( 
fprintf(stderr, "*s", mess ret.error text); 








} 
} else { 
fprintf(stderr, "Server failed to respond\n"); 
} 
) else ( 


fprintf(stderr, "Server not accepting requests |n'); 


return(0); 


(8) 最 后 是 两 个 用 于 删除 数据 的 函数 : 


int 


t 


del cdc entry(const char *cd catalog ptr) 


message db t mess send; 
message db t mess ret; 


mess send.client pid - mypid; 
mess send.request - s del cdc entry; 
strcpy(mess send.cdc entry data.catalog, cd catalog ptr); 


if (send mess to server(mess send)) ( 
if (read one response(&mess ret)) ( 
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if (mess ret.response == r success) ( 
return(1); 
) eise ( 
fprintf(stderr, "$s", mess ret.error text); 
) 
) else ( 
fprintf(stderr, "Server failed to respondin*); 
M 
) else ( 
fprintf (stderr, "Server not accepting requests"); 
) 
return(0); 


int del cát entry(const char *cd catalog ptr, const int track no) 


message db t mess send; 
message db t mess ret; 





mess send.client pid = mypid; 

mess send.request - s del cdt entry; 

Strcpy(mess send.cdt entry data.catalog, cd catalog ptr); 
mess send.cdt entry data.track no - track no; 


if (send mess to server(mess send)) ( 
if (read one response(&mess ret)) ( 
if (mess ret.response -- r success) ( 
return(1); 
) else ( 
fprintf(stderr, "8s", mess ret.error text); 
Hu 
) else ( 
fprintf(stderr, "Server failed to respond"); 
) 
) eise ( 
fprintf(stderr, "Server not accepting requests Wn*); 
) 
return(0); 


) 


2. 搜索 数据 库 

根据 CD 唱片 关键 字 进 行 搜索 的 函数 非常 复杂 。 调 用 者 希望 每 调用 它 一 次 就 开始 一 次 搜索 。 在 第 7 
章 中 ,为 了 满足 这 种 需求 在 第 一 次 调用 该 函数 时 将 *first_call_ptr 设 置 为 true， 这 样 它 将 返回 第 
一 个 匹配 记录 。 在 后 续 对 搜索 函数 的 调用 中 ， 我 们 将 *first_call_ptr 设 置 为 false， 这 样 它 返回 的 
是 后 续 的 匹配 记录 ， 每 次 调用 返回 一 个 。 

现在 ， 由 于 我 们 已 将 应 用 程序 划分 为 两 个 进程 ， 在 服务 器 中 就 不 能 再 允许 每 次 搜索 只 处 理 一 个 数 
据 项 了 ， 因 为 在 前 一 次 搜索 正在 进行 时 ， 可 能 会 有 另 一 个 客户 开始 请 求 服务 器 进行 另外 一 次 搜索 。 我 
们 也 不 能 让 服务 器 端 分 别 保存 每 个 客户 搜索 的 上 下 文 〈 即 搜索 已 到 达 的 位 置 )， 因 为 用 户 可 能 会 在 搜 
索 进行 到 一 半 时 ， 由 于 找到 了 想 找 的 CD 唱片 或 因为 客户 突然 中 断 而 停止 这 次 搜索 。 

我 们 可 以 改变 搜索 的 执行 方式 ， 也 可 以 像 我 们 在 这 里 选择 的 那样 把 这 些 复杂 性 隐藏 在 接口 例 程 
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中 。 我 们 的 做 法 是 ， 让 服务 器 把 搜索 的 可 能 匹配 结果 全 部 返回 并 保存 在 一 个 临时 文件 中 ， 直 到 客户 请 
求 它们 。 
(D) 这 个 函数 看 上 去 很 复杂 ， 但 实际 并 非 如 此 。 它 调用 了 3 个 管道 函数 〈 我 们 将 在 下 一 节 中 介绍 它 


们 ): send mess to server. start resp from serverfülread resp from server. 


Cdc.entry search cdc entry(const char *cd catalog ptr, int *first call ptr) 
t 


message_db_t mess_send; 
message_db_t mess_ret; 


static FILE *work_file = (FILE *)0; 
static int entries_matching = 0; 
các entry ret val; 


ret val.catalog[0] = 'X0'; 


if (!work file && (*first call ptr == 0)) return(ret, val); 


Q) 第 一 次 调用 这 个 函数 进行 搜索 时 ，*first_call_ptr 被 设置 为 true。 我 们 最 好 现在 就 将 它 设 
置 为 false， 以 免 后 面 忘记 修改 它 。 然 后 创建 临时 文件 work_file 并 初始 化 客户 消息 结构 。 


if (*first call ptr) { 
*first call ptr = 0; 
if (work file) fclose(work file); 
work file - tmpfile(); 
if (Iwork file) return(ret val); 


mess send.client pid - mypid; 
mess send.request = s find cdc entry; 
strcpy (mess, send.cdc entry data.catalog, cd catalog ptr); 


(3) 接 下 来 是 三 重 条 件 判 断 ， 它 将 调用 pipe_imp.c 文 件 中 的 函数 。 如 果 消 息 被 成 功 发 送 给 服务 器 ， 
客户 就 开始 等 待 服务 器 的 响应 。 成 功 读 取 了 服务 器 返回 的 响应 后 ， 就 将 搜索 的 匹配 结果 保存 到 客户 的 
临时 文件 work_file 中 ， 同 时 增加 匹配 计数 器 entries_matching 的 值 。 


if (send mess to server(mess send)) ( 
if (start resp from server()) ( 
while (read resp from server (&mess. DA 
if (mess_ret.response == r success) { 
fwrite(&mess ret.cdc entry data, sizeof(cdc entry), 1, work file]; 
entries matchinges; 
} eise ( 
break; 





) 
) /* while */ 
) eise ( 
fprintf(stderr, "Server not respondingn*); 
) 
) else { 
fprintf(stderr, "Server not accepting requests|n"); 
) 


(4) 接 下 来 的 测试 检查 搜索 是 否 找到 匹配 数据 。 然 后 通过 fseek 调 用 设置 work_file 的 下 一 个 数据 
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写 入 位 置 。 


if (entries matching == 0) ( 
fclose(work file); 
work file = (FILE *)0; 
return(ret, val); 


} 
(void)fseek(work file, OL, SEEK SET); 


(5) 如 果 这 不 是 本 次 搜索 操作 中 第 一 次 调用 搜索 函数 ， 代 码 将 检查 是 否 还 有 其 他 匹配 。 


下 一 个 匹配 数据 项 读 到 ret_val 结 构 中 。 此 前 的 检查 用 来 确保 还 有 匹配 项 存在 。 


) else ( 
/* not *first call ptr */ 
if (entries matching == 0) ( 
£close(work file); 
work file - (FILE *)0; 
return (ret, val); 


) 


fread(&ret val, sizeof(cdc entry), 1, work file); 
entries matching--; 


return(ret. val); 


) 
13.7.4 ”服务 器 接口 server.c 


最 后 ， 把 


如 同 客户 端 有 个 用 于 app_ui .c 程 序 的 接口 ， 服 务 器 端 也 需要 一 个 程序 用 来 控制 ca_abm.c (在 以 


前 的 版 本 中 





字 是 cd_access.c)。 下 面 是 服务 器 的 main 函 数 代码 。 


(1) 首先 声明 一 些 全 局 变量 、process_command 函 数 的 原型 和 一 个 用 来 完成 退出 清理 工作 的 


catch_signals 函 数 。 


#include <unistd.h> 
#include «stdlib.h» 
#include <stdio.h> 
#include «fcntl.h» 
#include «limits.h» 
#include «signal.h» 
#include <string.h> 
#include <errno.h> 
#include <sys/types.h> 
#include <sys/stat.h> 


#include "cd data.h* 
include "cliserv.h" 


int save errno; 
static int server running - 1; 


static void process command(const message db t mess command); 
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void catch signals() 
€ 


} 


server_running = 0; 


(2) 下 面 是 main 函 数 的 代码 。 在 检查 完 信号 捕获 例 程 可 以 正常 工作 后 ， 程 序 检查 用 户 是 否 在 命令 
行 上 输入 了 -i 选项 ,如 果 有 , 它 就 创建 一 个 新 数据 库 。 如果 调用 ca_abm.c 中 的 database_initialize 
函数 失败 ， 就 给 出 一 条 错误 消息 。 如 果 一 切 正常 则 服务 器 开始 运行 ， 来 自 客户 的 任何 请 求 都 将 被 发 往 
process_command 函 数 ， 我 们 后 面 将 会 讲 到 这 个 函数 。 


int main(int argc, char *argv[]) ( 


} 


struct sigaction new taction, old action; 
message db t mes: 
int database init type = 9; 





new action.sa handler - catch signals; 

sigemptyset (&new action.sa mask); 

new action.sa flags = 0; 

if ((sigaction(SIGINT, &new action, &old action) != 0) || 
(sigaction(SIGHUP, &new action, &old action) != 0) || 
(sigaction(SIGTERM, &new action, &old action) !- 0)) ( 
fprintf(stderr, "Server startup error, signal catching failedWn'); 
exit (EXIT_FAILURE) ; 

) 


if (argc > 1) ( 
argves; 
if (strncmp(*-i*, *argv, 2) == 0) database init type = 1; 
) 
if (!database initialize(database init type)) ( 
fprintf(stderr, "Server error:-V 
could not initialize databaseWn*); 
exit(EXIT FAILURE); 
) 


if (!server starting()) exit(EXIT FAILURE); 
while(server running) ( 


if (read request from client(&mess command)) ( 
command (mess, command) ; 





if(server running) fprintf(stderr, *Server ended - can not V 
read pipeWn*); 
server running = 0; 


$ 
) /* while */ 
server ending(); 
exit(EXIT SUCCESS]; 


(3) 所 有 客户 的 消息 都 将 被 发 往 process_command 函 数 ， 在 那里 它们 被 放 入 一 个 case 语 句 ， 进 而 
调用 cq_abm.c 中 相应 的 函数 。 
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static void process command(const message db t comm) 
{ 
message db t resp. 
int first time - 





resp - comm; /* copy command back, then change resp as required */ 


if (!start resp to client(resp)) { 
fprintf(stderr, "Server Warning:-V 
start resp to client $d failed\n", resp.client pid); 
return; 


) 


resp.response - r success; 
memset(resp.error text, '\0', sizeof(resp.error text)); 
save errno - 0; 


Switch(resp.request) ( 
case s create new database: 
if (!database initialize(1)) resp.response - r failure; 
break; 
case s get, cdc entry: 
resp.cdc entry data = 
get. cdc, entry (comm.cdc entry data.catalog); 








break; 
case s get. cdt. entry 





resp.cdt entry data = 
get. cát. entry (comm.cát. entry data.catalog, 
comn.cdt, entry data.track no); 
break; 
add cdc entry: 
if (!add cdc entry(comm.cdc entry data)) resp.response = 
r failure; 


case 





break; 
case s add cát entry: 
if (ladd cdt entry(comm.cdt entry data)) resp.response = 
r failure; 
break; 
del các entry: 
if (del các entry(comm.cdc entry data.catalog)) resp.response 
= r failure; 





break 
case s del cdt entry: 
if (!del cdt entry(comm.cdt entry data.catalog, 
Comm.cdt entry data.track no)) resp.response = r failure; 
break; 
case s find các entry: 
do ( 
resp.cdc entry data = 
search cdc entry(comm.cdc entry data.catalog, 
&first time); 
if (resp.cdc entry data.catalog[0] != 0) ( 
resp.response - r success; 
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if (!send resp to client(resp)) ( 


fprintf(stderr, "Server Warning:-V 


failed to respond to %d\n", resp.client pid); 


break; 
) 
) else ( 
resp.response - r find no more; 


) while (resp.response -- r success); 
break; 
default: 
resp.response - r failure; 
break; 
) /* switch */ 


Sprintf(resp.error text, "Command failed: An tis n", 


strerror(save errno)); 


if (!send resp to client(resp)) ( 
fprintf(stderr, "Server Warning:-V 


failed to respond to %d\n", resp.client pid); 


) 


end resp to client(); 
return; 

) 

在 介绍 管道 的 具体 实现 之 前 ， 我 们 先 来 看 看 ， 在 客户 和 服 
务 器 进程 之 间 传 递 数据 时 各 种 事件 发 生 的 先后 顺序 。 图 13-9 显 
示 客 户 和 服务 器 进程 在 各 自 启动 之 后 ， 双 方 在 处 理 命令 和 响应 
时 的 循环 情况 。 

在 具体 实现 中 ， 情 况 要 更 复杂 一 些 。 因 为 在 搜索 请 求 中 ， 
客户 向 服务 器 传递 一 条 命令 ， 然 后 等 待 从 服务 器 中 接收 一 个 或 
多 个 响应 。 这 就 使 得 情况 更 复杂 了 ， 但 主要 是 在 客户 端 。 
13.7.5 管道 

下 面 是 实现 管道 功能 的 pipe_imp.c 文 件 , 它 同时 包含 客户 
端 和 服务 器 端的 函数 。 

在 第 10 章 中 我 们 见 到 过 DEBUG_TRACE 标 志 ， 我 们 

可 以 通过 定义 该 标志 来 显示 ， 客 户 和 服务 器 进程 在 互 

相传 递 消息 时 ， 各 个 调用 的 执行 顺序 . 

1. 管道 实现 的 开始 部 分 

(1) 首先 是 #include 语 句 : 


include "cd data.h" 
finclude "cliserv.h" 


(2) 我 们 还 定义 了 一 些 在 此 文件 里 的 函数 中 会 用 到 的 值 : 




















13-9 
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static int server fd = -1; 

static pid t mypid - 0; 

static char client pipe name[PATH MAX + 1] = ('V0'); 
static int client fd = -1; 

static int client write fd - -1; 


2. 服务 器 端 函数 

接 下 来 ， 我 们 来 看 服务 器 端的 函数 。 第 一 部 分 显示 打开 、 关 闭 命名 管道 和 读 取 来 自 客户 的 消息 的 
函数 。 第 二 部 分 显示 用 于 打开 、 发 送 和 关闭 客户 管道 的 代码 ， 客 户 管道 名 基于 客户 包含 在 其 请 求 消息 
中 的 进程 ID 来 确定 。 

e 服务 器 函数 


(1) server_starting 例 程 先 为 服务 器 创建 一 个 它 将 从 中 读 取 命令 的 命名 管道 ， 然 后 以 只 读 方 式 
打开 这 个 管道 。 这 个 open 调 用 将 阻塞 到 有 客户 以 写 方式 打开 这 个 管道 为 止 。 使 用 阻塞 模式 可 以 使 服务 
器 在 等 待 发 送 过 来 的 命令 时 对 管道 执行 阻塞 式 读 取 。 


int server starting(void) 


if DEBUG TRACE 


printf(*$d :- server starting()An*, getpid()); 
fendif 


unlink(SERVER PIPE); 

if (mkfifo(SERVER PIPE, 0777) == -1) ( 
fprintf(stderr, "Server startup error, no FIFO createdin'); 
return(0) ; 

) 


if ((server fd = open(SERVER PIPE, O RDONLY)) == -1) ( 
if (errno == EINTR) return(0); 
fprintf (stderr, "Server startup error, no FIFO openedin'); 
return(0) ; 
Y 
return(1); 
) 


(2) 当 服务 器 结束 时 ， 它 删除 命名 管道 ， 这 样 客户 就 可 以 检测 出 没有 服务 器 在 运行 : 
void server_ending (void) 
t 
#if DEBUG TRACE 
printf("$d :- server ending() n*, getpid()); 
fendif 


(void) close (server fd); 
(void)unlink (SERVER PIPE); 
) 


(3) 下 面 给 出 的 read_request_from_client 函 数 会 阻塞 在 对 服务 器 管道 的 读 操 作 上 , 直到 有 客户 
向 其 中 写 入 一 条 消息 为 止 : 
int read request from client(message db t *rec ptr) 
t 
int return code = 0; 
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int read bytes; 


fif DEBUG TRACE 
printf(*&d :- read request from client()Wn', getpid()); 
fendif 


if (server fd !- -1) ( 
read bytes = read(server fd, rec ptr, sizeof(*rec ptr)); 


) 
return (return_code) ; 

) 

(4) 如 果 出 现 没有 任何 客户 以 写 方式 打开 这 个 管道 的 特殊 情况 ，reaa 调 用 将 返回 9。 也 就 是 说 ， 它 
检测 到 一 个 EoF， 此 时 服务 器 会 关闭 管道 并 重新 打开 它 ， 这 样 服务 器 就 可 以 阻塞 到 有 客户 打开 这 个 管 
道 为 止 。 这 与 服务 器 第 一 次 启动 时 的 情况 完全 一 样 ， 等 于 我 们 重新 初始 化 了 服务 器 。 把 下 面 这 些 代码 
插 到 上 面 的 函数 中 去 : 

if (read bytes == 0) ( 
(void)close (server, fd) ; 
if ((server fd = open(SERVER PIPE, O RDONLY)) == -1) ( 
if (errno !- EINTR) ( 
fprintf(stderr, "Server error, FIFO open failedin"); 


) 
return(0); 
H 7 
read bytes = read(server fd, rec ptr, sizeof(*rec ptr)); 
) 
if (read bytes == sizeof(*rec ptr)) return code = 1; 
服务 器 是 一 个 进程 ， 它 可 能 同时 为 许多 客户 服务 。 因 为 每 个 客户 用 不 同 的 管道 接收 响应 ， 所 以 服 
务 器 需要 使 用 不 同 的 管道 来 给 不 同 的 客户 发 送 响应 。 而 由 于 文件 描述 符 是 一 种 有 限 资源 ， 所 以 服务 器 
只 有 在 需要 发 送 数据 时 才 会 以 写 方式 打开 一 个 客户 管道 。 
我 们 将 打开 、 写 入 和 关闭 客户 管道 分 离 为 3 个 独立 的 函数 。 这 是 为 了 适应 数据 库 搜索 返回 多 个 搜 
索 结果 的 情况 ， 这 样 我 们 可 以 只 打开 管道 一 次 ， 写 入 多 个 响应 ， 然 后 再 关闭 它 。 
e 探测 管道 
(1) 首先 打开 客户 管道 : 
int start resp to client(const message db t mess to send) 
T 


#if DEBUG, TRACE 
printf(*$&d :- start resp to client()Wn', getpid()); 


#endif 

(void)sprintf(client pipe name, CLIENT PIPE, mess to send.client pid); 
if ((client.fd = open(client pipe name, O WRONLY)) == -1) return(0); 
return(1); 


y 
(2) 消息 都 是 通过 调用 这 个 函数 发 送出 去 的 。 我 们 后 面 就 会 看 到 对 应 的 用 于 接收 消息 的 客户 端 函数 。 
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int send resp to client(const message db t mess to send) 
t 
int write bytes; 


#if DEBUG TRACE 
printf(*$d :- send resp to client()|n*, getpid()); 
tendif 


if (client_fd == -1) return(0); 

write bytes = write(client fd, &mess to send, sizeof(mess to send)); 
if (write bytes !- sizeof(mess to send)) return(0); 

return(1); 


) 
(3) 最 后 ， 关 闭 客户 管道 : 


void end_resp_to_client (void) 
{ 
#if DEBUG TRACE 
printf(*&d :- end resp to client()in', getpid()); 
#endif 


if (client_fd != -1) { 
(void)close(client. fd); 
client fd = -1; 


) 


3. 客户 端 函数 

pipe_imp.c 文 件 中 与 服务 器 端 函数 互补 的 是 客户 端 函数 ， 除 了 那个 名 为 send_mess_ko_server 
的 函数 ， 它 们 都 与 服务 器 端 函数 很 相似 。 

o 客户 函数 

(1) 在 检查 到 服务 器 可 访问 后 ，client_starting 函 数 初始 化 客户 端 管道 ; 

int client starting(void) 

( 


#if DEBUG TRACE 
printf(*&d :- client startingWn', getpid()); 
#endif 


mypid = getpid(); 

if ((server fd = open(SERVER PIPE, O WRONLY)) == -1) ( 
fprintf (stderr, "Server not runningin*); 
return(0); 

) 


(void)sprintf(client, pipe name, CLIENT PIPE, mypid); 
(void)unlink(client. pipe name); 
if (mkfifo(client pipe name, 0777) == -1) ( 
fprintf(stderr, "Unable to create client pipe $s\n", 
client pipe name); 
return(0); 
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return(1); 
) 


(2) client_ending 函 数 的 作用 是 关闭 文件 描述 符 并 删除 目前 多 余 的 命名 管道 : 


void client, ending(void) 
( 
$if DEBUG TRACE 
printf(**d :- client ending()W*, getpid()); 
#endif 


if (client write fd != -1) (void)close(client write fd); 
-1) (void)close(client. fd); 

-1) (void)close(server, fd); 
(void)unlink(client pipe name); 





) 
(3) send_mess_to_server 函 数 的 作用 是 通过 服务 器 管道 传递 请 求 : 


int send mess to server(message db t mess to send) 
t 
int write_bytes; 


#if DEBUG_TRACE 
printf(*&d :- send mess_to_server()\n", getpid()); 
#endif 


if (server_fd == -1) return(0); 
mess to send.client pid - mypid; 
write bytes - write(server fd, &mess to send, sizeof(mess to send)); 
if (write bytes != sizeof(mess to send)) return(0); 
return(1); 
) 
与 我 们 前 面 看 到 的 服务 器 端 函 数 相 对 应 ， 为 了 能 够 处 理 多 个 搜索 结果 ， 客 户 在 从 服务 器 取 回 结 
时 也 使 用 了 3 个 函数 。 
e 取得 服务 器 返回 的 结果 
(1) 这 个 客户 函数 开始 监听 服务 器 的 响应 。 它 先 以 只 读 方 式 打开 一 个 客户 管道 ， 然 后 又 以 只 写 方 
式 重新 打开 这 个 管道 。 我 们 将 在 本 节 的 稍 后 部 分 解释 这 样 做 的 原因 。 


int start resp from server(void) 





*if DEBUG, TRACE 
printf(*$d :- start resp from server()An*, getpid()]; 
#endif 


if (client pipe name[0] == 'V0') return(0); 
if (client fd != -1) return(1); 


client fd = open(client pipe name, O RDONLY); 

if (client fd !- -1) ( 
client write fd - open(client pipe name, O WRONLY); 
if (client write fd !- -1) return(1); 
(void)close(client fd); 
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client fd = -1; 


return(0); 


(2) 下 面 是 具体 负责 从 服务 器 读 取 响应 的 reaa 调 用 ， 它 将 取 回 匹配 的 数据 库 条 目 : 
int read resp from server(message db t *rec ptr) 


int read bytes; 
int return code - 0; 


#if DEBUG TRACE 
printf("&d :- read resp from server()|n', getpid()); 
fendif 


if (!rec ptr) return(0); 
if (client fd -- -1) return(0); 


read bytes - read(client fd, rec ptr, sizeof(*rec ptr)); 
if (read bytes == sizeof(*rec ptr)) return code = 1; 
return (return_code) ; 

) 

(3) 最 后 这 个 客户 函数 标记 服务 器 响应 的 结束 : 


void end resp. from server (void) 
1 *if DEBUG, TRACE 
printf(**d ;- end resp from server()Xn', getpid()); 
#endif 
/* This function is empty in the pipe implementation */ 

) 

在 start_resp_from_server 函 数 中 第 二 个 以 写 方式 打开 客户 管道 的 调用 是 : 

client write fd = open(client pipe name, O WRONLY); 
它 用 来 防止 一 个 竞争 条 件 的 出 现 ， 这 个 竞争 条 件 会 在 服务 器 需要 响应 来 自 同一 个 客户 的 快速 、 连 续 的 
多 个 请 求 时 发 生 。 

为 了 将 这 个 问题 解释 得 更 清楚 ， 我 们 来 看 看 这 个 事件 发 生 的 过 程 。 

(D 客户 发 送 一 个 请 求 给 服务 器 。 

(2) 服务 器 读 取 请 求 ， 打 开 客 户 管道 并 发 回响 应 ， 但 在 关闭 客户 管道 之 前 被 挂 起 。 

(3) 客户 以 读 方式 打开 自己 的 管道 ， 读 取 第 一 个 响应 并 关闭 管道 。 

(4) 客户 然后 发 送 一 个 新 命令 并 再 次 以 读 方式 打开 客户 管道 。 

(5) 此 时 服务 器 恢复 运行 ， 关 闭 它 那 端的 客户 管道 。 

糟糕 的 是 ， 此 时 客户 正 尝试 从 这 个 管道 读 取 数 据 ， 等 待 自 己 下 一 个 请 求 的 响应 ， 但 因为 已 无 进程 
以 写 方式 打开 这 个 客户 管道 ， 所 以 reaq 调 用 将 返回 0 字 节 。 

通过 允许 客户 以 读 写 两 种 方式 打开 它 自己 的 管道 ， 就 消除 了 反复 重新 打开 这 个 管道 的 需要 ， 从 
而 避免 了 竞争 条 件 的 产生 。 因 为 客户 永远 也 不 会 向 这 个 管道 写 数据 ， 所 以 不 会 有 读 到 错误 数据 的 危 
险 。 
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13.7.6 ”对 CD 数据 库 应 用 程序 的 总 结 


现在 ， 我 们 已 经 把 CD 数据 库 应 用 程序 分 为 客户 和 服务 器 两 部 分 了 ， 这 使 我 们 可 以 对 用 户 界面 和 
底层 的 数据 库 技术 分 别 进行 独立 的 开发 。 我 们 可 以 看 到 ， 一 个 精心 定义 的 数据 库 接口 可 以 让 应 用 程序 
的 每 个 主要 部 分 充分 地 使 用 计算 机 资源 。 进一步 地 , 我 们 还 可 以 把 管道 实现 方案 改进 为 网 络 实现 方案 ， 
并 使 用 一 个 专用 的 数据 库 服务 器 。 我 们 将 在 第 15 章 学 习 更 多 的 网 络 编程 。 


13.8 小结 


在 本 章 中 ， 我 们 介绍 了 如 何 使 用 管道 在 进程 之 间 传递 数据 。 首 先 ， 介 绍 了 通过 popen 或 pipe 调 用 
创建 的 未 命名 管道 ， 并 且 讨论 了 如 何 使 用 管道 和 aup 调 用 把 数据 从 一 个 程序 传递 到 另 一 个 程序 的 标准 
输入 。 接 下 来 ， 我 们 介绍 了 命名 管道 以 及 如 何在 不 相关 的 程序 之 间 传递 数据 。 最 后 ， 实 现 了 一 个 简单 
的 客户 /服务 器 例子 ，FIFO 的 使 用 不 仅 向 我 们 提供 了 进程 间 的 同步 ， 还 提供 了 双向 的 数据 流 。 
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fk 我 们 将 讨论 一 组 进程 间 通 信 的 机 制 ， 它 们 最 初 由 AT&T System V2 版 本 的 UNIX 引 
LE: 由 于 这 些 机 制 都 出 现在 同一 个 版 本 中 并 且 有 着 相似 的 编程 接口 ， 所 以 它们 又 常 被 称 为 
IPC (Inter-Process Communication, HEERA) 机制， 或 被 更 常见 的 称 为 System VIPC。 正 如 我 们 所 
看 到 的 ， 它 们 并 不 是 进程 间 通 信 的 唯一 方法 ， 但 人 们 通常 把 这 些 特定 的 机 制 称 为 System V IPC. 

在 本 章 中 ， 我 们 将 介绍 以 下 几 方 面 的 内 容 。 

口 信号 量 ， 用 于 管理 对 资源 的 访问 。 

口 共享 内 存 : 用 于 在 程序 之 间 高 效 地 共享 数据 。 

O 消息 队列 : 在 程序 之 间 传递 数据 的 一 种 简单 方法 。 


14.1 信号 量 


当 我 们 编写 的 程序 使 用 了 线程 时 ， 不 管 它 是 运行 在 多 用 户 系统 上 、 多 进程 系统 上 ， 还 是 运行 在 多 

用 户 多 进程 系统 上 , 我 们 通常 会 发 现 , 程序 中 存在 着 一 部 分 临界 代码 , 我们 需要 确保 只 有 一 个 进程 (或 
-个 执行 线程 》 可 以 进入 这 个 临界 代码 并 拥有 对 资源 独占 式 的 访问 权 。 

信号 量 有 着 复杂 的 编程 接口 ， 但 幸运 的 是 ， 我 们 可 以 很 轻松 地 为 自己 提供 一 个 更 简单 的 接口 ， 它 
足够 应 付 大 多 数 信号 量 编程 的 问题 。 

第 7 章 的 第 一 个 示例 程序 用 abm 来 访问 数据 库 。 如 果 有 多 个 程序 试图 在 同一 时 间 更 新 这 个 数据 库 ， 
数据 就 可 能 会 遭 到 破坏 。 两 个 不 同 的 程序 要 求 不 同 的 用 户 向 数据 库 输入 数据 ， 这 本 身 并 没有 错 ， 问 题 
只 可 能 出 现在 对 数据 库 进行 更 新 的 那 部 分 代码 上 。 这 部 分 真正 执行 数据 更 新 的 代码 需要 独占 式 地 执 
行 ， 它 们 被 称 为 临界 区 域 。 它 们 通常 只 在 一 个 大 型 程序 中 占据 一 小 段 的 代码 。 

为 了 防止 出 现 因 多 个 程序 同时 访问 一 个 共享 资源 而 引发 的 问题 ， 我 们 需要 有 一 种 方法 ， 它 可 以 通 
过 生成 并 使 用 令 牌 来 授权 ， 在 任 一 时 刻 只 能 有 一 个 执行 线程 访问 代码 的 临界 区 域 。 在 第 12 章 我 们 简单 
介绍 了 一 些 线程 特定 的 方法 ， 我 们 可 以 在 使 用 线程 的 程序 中 通过 互 斥 量 或 信号 量 来 控制 对 临界 区 域 的 
访问 。 在 本 章 中 ， 我 们 又 回 到 信号 量 的 主题 上 ， 但 将 对 它们 如 何在 不 同 的 进程 之 间 使 用 做 更 具 普遍 意 
义 地 介绍 。 

我 们 在 本 章 介绍 的 信号 量 函 数 比 在 第 12 章 看 到 的 用 于 线程 的 信号 量 函数 要 更 通用 ， 所 以 

请 不 要 把 这 两 者 混淆 。 

要 想 编写 通用 的 代码 ， 以 确保 程序 对 某 个 特定 的 资源 具有 和 独占 式 的 访问 权 是 非常 困难 的 。 虽 然 有 
一 个 名 为 Dekker 算 法 的 解决 方法 ， 但 这 个 算法 依赖 于 “ 忙 等 待 ” 或 “ 自 旋 锁 ”。 也 就 是 说 ， 一 个 进程 
要 持续 不 断 地 运行 以 等 待 某 个 内 存 位 置 被 改变 。 在 像 Linux 这 样 的 多 任务 环境 中 ， 人 们 并 不 愿意 使 用 
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这 种 浪费 CPU 资 源 的 处 理 方法 。 但 如 果 硬件 支持 独占 式 访问 一 般 是 通过 特定 的 CPU 指 令 的 形式 )， 
那么 情况 就 变 得 简单 多 了 .。 一 个 硬件 支持 的 例子 就 是 , 用 一 条 指令 以 原子 方式 访问 并 增加 寄存 器 的 值 ， 
在 这 个 读 取 / 增 加 / 写 入 操作 执行 的 过 程 中 不 会 有 其 他 指令 〈 甚 至 一 个 中 断 ) RE. 

我 们 前 面 见 过 的 一 种 可 能 的 解决 方法 是 ， 使 用 带 o_ExcL 标 志 的 open 函 数 来 创建 锁 文件 ， 它 提供 
了 原子 化 的 文件 创建 方法 。 它 允许 一 个 进程 通过 获取 一 个 令 牌 〈 即 新 创建 的 文件 ) 来 取得 成 功 。 这 个 
方法 比较 适合 于 处 理 简单 的 问题 ， 但 对 于 更 复杂 的 例子 ， 它 就 显得 比较 杂乱 且 缺 乏 效率 。 

荷兰 计算 机 科学 家 Edsger Dijkstra 提 出 的 信号 量 概念 是 在 并 发 编程 领域 迈 出 的 重要 一 步 。 正如 我 们 
在 第 12 章 所 讨论 的 ， 信 号 量 是 一 个 特殊 的 变量 ， 它 只 取 正 整数 值 ， 并 且 程序 对 其 访问 都 是 原子 操作 。 
在 本 章 中 ， 我 们 将 对 这 个 较 早 的 简化 定义 做 进一步 的 解释 。 我 们 将 详细 说 明 信 号 量 是 如 何 工作 的 ， 如 何在 
不 同 进程 之 间 使 用 具备 更 通用 功能 的 函数 ， 而 不 是 像 我 们 在 第 12 章 中 看 到 的 那个 多 线程 程序 的 特例 。 

信号 量 的 一 个 更 正式 的 定义 是 : 它 是 一 个 特殊 变量 ， 只 允许 对 它 进行 等 待 〔《wait) 和 发 送信 号 
(Csignal) 这 两 种 操作 。 在 Linux 编 程 中 ,“ 等 待 ”和 “发 送信 号 ”都 已 具有 特殊 的 含义 ， 所 以 我 们 
将 用 原先 定义 的 符号 来 表示 这 两 和 操作。 

口 P〈 信 号 量变 量 ): 用 于 等 待 。 

Ov (信号 量变 量 ): 用 于 号 。 

这 两 个 字母 分 别 米 自 于 荷兰 语 单词 passeren 《传递 ， 就 好 像 位 于 进入 临界 区 域 之 前 的 检查 点 ) 和 
vrijgeven 《给予 或 释放 ， 就 好 像 放 弃 对 临界 区 域 的 控制 权 )。 在 与 信号 量 关 联 的 内 容 中 ， 你 可 能 还 会 看 
SRI "JE" Cup) 和 “ 关 ”(down)， 它 们 取 自 开 、 关 信号 标志 的 用 法 。 

14.1.1 信号 量 的 定义 

最 简单 的 信号 量 是 只 能 取 值 0 和 和 1 的 变量 ， 即 二 进 制 信号 量 。 这 也 是 信号 量 最 常见 的 一 种 形式 。 可 
以 取 多 个 正 整数 值 的 信号 量 被 称 为 通用 信号 量 在 本 章 后 面 的 内 容 中 , 我 们 将 集中 讨论 二 进 制 信号 量 。 

PEV 操 作 的 定义 非常 简单 。 假 设 有 一 个 信号 量变 量 sv， 则 这 两 个 操作 的 定义 如 表 14-1 所 示 。 

表 14-1 


Plsv) 如 果 sv 的 值 大 于 零 ， 就 给 它 减 去 1; 如 果 它 的 值 等 
visvi 如 果 有 其 他 进程 因 等 待 sv 而 被 挂 起 ， 就 让 它 恢复 









就 挂 起 该 进程 的 执行 
了 ; 如 果 没 有 进程 因 等 待 sv 而 被 挂 起 ， 就 给 它 加 1 


还 可 以 这 样 看 信号 量 : 当 临 界 区 域 可 用 时 ， 信 号 量变 量 sv 的 值 是 true， 然 后 P (sv) 操作 将 它 减 1 
使 它 变 为 false 以 表示 临界 区 域 正在 被 使 用 ， 当 进程 离开 临界 区 域 时 ， 使 用 Vv cov) 操作 将 它 加 1， 使 临 
界 区 域 再 次 变 为 可 用 。 注 意 ， 只 用 一 个 普通 变量 进行 类 似 的 加 减法 是 不 行 的 ， 因 为 在 C、CH+、C# 或 
几乎 任何 一 个 传统 的 编程 语言 中 ， 都 没有 一 个 原子 操作 可 以 满足 检测 变量 是 否 为 crue， 如 果 是 再 将 该 
变量 设置 为 false 的 需要 。 这 也 是 信号 量 操作 如 此 特殊 的 原因 。 


14.1.2 一 个 理论 性 的 例子 


我 们 用 一 个 简单 的 理论 性 的 例子 来 说 明 其 工作 原理 。 假 设 有 两 个 进程 proc1 和 proc2， 这 两 个 进 
程 都 需要 在 其 执行 过 程 中 的 某 一 时 刻 对 一 个 数据 库 进行 独占 式 的 访问 。 我 们 定义 一 个 二 进 制 信号 量 
sv， 该 变量 的 初始 值 为 1， 两 个 进程 都 可 以 访问 它 。 要 想 对 代码 中 的 临界 区 域 进行 访问 ， 这 两 个 进程 
都 需要 执行 相同 的 处 理 步 骤 ， 事 实 上 ， 这 两 个 进程 可 以 只 是 同一 个 程序 的 两 个 不 同 执行 实例 。 

两 个 进程 共享 信号 量变 量 sv。 一 旦 其 中 一 个 进程 执行 了 P (sv) 操 作 ， 它 将 得 到 信号 量 ， 并 可 以 进 
入 临界 区 域 。 而 第 二 个 进程 将 被 阻止 进入 临界 区 域 ， 因 为 当 它 试图 执行 P(sv) 操 作 时 ， 它 会 被 挂 起 以 
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等 待 第 一 个 进程 离开 临界 区 域 并 执行 v(sv) 操作 释放 信号 量 。 
需要 的 伪 代 码 对 两 个 进程 都 是 相同 的 ， 如 下 所 示 : 


semaphore sv = 1; 


loop forever ( 
P(sv); 
critical code section; 
Visv); 
noncritical code section; 


) 
这 段 代码 相当 简单 ， 这 是 因为 Pv 操作 的 功能 非常 强大 。 图 14-1 显 示 了 PV 操作 是 如 何 把 守 代码 中 的 
临界 区 域 的 。 


进程 A 的 执行 线程 进程 B 的 执行 线程 






信号 量 的 P 操 作 


进程 A 的 非 i| “进程 B 的 非 
临界 区 域 部 分 i 临界 区 域 部 分 
任 一 时 刻 只 
允许 一 个 执 
行 线程 进入 
临界 区 域 






















信号 量 的 V 操 作 





图 141 


14.1.3. Linux 的 信号 量 机 制 


现在 ， 我 们 已 了 解 了 信号 量 的 含义 及 其 工作 原理 ， 接 下 来 我 们 来 看 看 ， 在 Linux 系 统 中 是 如 何 实 
现 这 些 功能 的 。Linux 系 统 中 的 信号 量 接口 经 过 了 精心 设计 ， 它 提供 了 比 通常 所 需 更 多 的 机 制 。 所 有 
的 Linux 信 号 量 函 数 都 是 针对 成 组 的 通用 信号 量 进行 操作 ， 而 不 是 只 针对 一 个 二 进 制 信号 量 。 起 
来 ， 这 好 像 把 事情 弄 得 更 复杂 了 ， 但 在 一 个 进程 需要 锁定 多 个 资源 的 复杂 情况 中 ， 这 种 能 够 对 一 组 信 
号 量 进行 操作 的 能 力 是 一 个 巨大 的 优势 。 在 本 章 中 ， 我 们 将 集中 讨论 单个 信号 量 的 使 用 ， 因 为 在 绝 大 
多 数 情况 下 ， 使 用 它 就 足够 了 。 

信号 量 函 数 的 定义 如 下 所 示 : 


#include «sys/sem.h» 






int semctl(int sem id, int sem num, int command, 
int semget(key t key, int num sems, int sem fl 
int semop(int sem id, struct sembuf *sem ops, 












ile t num sem ops); 
头 文件 sys/sem.h 通 常 依赖 于 另 两 个 头 文件 sys/types.h 和 sys/ipc.h。 一般 情况 
下 ,它们 都 会 被 sys/sem.h 自 动 包含 , 因此 不 需要 为 它们 明确 添加 相应 的 #include 语 句 。 
在 逐个 介绍 这 些 函 数 时 ,请 记 住 , 这 些 函 数 都 是 用 来 对 成 组 的 信号 量 值 进行 操作 的 . 
这 使 得 ， 对 它们 的 操作 要 比 单个 信号 量 所 需要 的 操作 复杂 得 多 . 


参数 key 的 作用 很 像 一 个 文件 名 ， 它 代表 程序 可 能 要 使 用 的 某 个 资源 ， 如 果 多 个 程序 使 用 相同 的 
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key 值 ， 它 将 负责 协调 工作 。 与 此 类 似 ， 由 semget 函 数 返 回 的 并 用 在 其 他 共享 内 存 函数 中 的 标识 符 也 
与 fopen 返 回 的 FILE* 文 件 流 很 相似 ， 进 程 需 要 通过 它 来 访问 共享 文件 。 此 外 ， 类 似 于 文件 的 使 用 情 
况 ， 不 同 的 进程 可 以 用 不 同 的 信号 量 标 识 符 来 指向 同一 个 信号 量 。 对 于 我 们 将 在 本 章 讨论 的 所 有 IPC 
机 制 来 说 ， 这 种 一 个 键 加 上 一 个 标识 符 的 用 法 是 很 常见 的 ， 尽 管 每 个 机 制 都 使 用 独立 的 键 和 标识 符 。 

1. semget 函 数 

semget 函 数 的 作用 是 创建 一 个 新 信号 量 或 取得 一 个 已 有 信号 量 的 键 : 

int semget(key t key, int num_sems，int sem flags); 

第 一 个 参数 key 是 整数 值 ， 不 相关 的 进程 可 以 通过 它 访问 同一 个 信号 量 。 程 序 对 所 有 信号 量 的 访 
问 都 是 间接 的 ， 它 先 提供 一 个 键 , 再 由 系统 生成 一 个 相应 的 信号 量 标识 符 。 只 有 semget 函数 才 直 接 使 
用 信号 量 键 ， 所 有 其 他 的 信号 量 函数 都 是 使 用 由 semget 函 数 返回 的 信号 量 标识 符 。 

有 一 个 特殊 的 信号 量 键 值 ITPC_PRIVATE， 它 的 作用 是 创建 一 个 只 有 创建 者 进程 才 可 以 访问 的 信号 
量 ， 但 这 个 键 值 很 少 有 实际 的 用 途 。 在 创建 新 的 信号 量 时 ， 你 需要 给 键 提供 一 个 唯一 的 非 零 整数 。 

num_sems 参 数 指定 需要 的 信号 量 数目 。 它 几乎 总 是 取 值 为 1。 

sem_flags 参 数 是 一 组 标志 ， 它 与 open 函 数 的 标志 非常 相似 。 它 低 端 的 9 个 比特 是 该 信号 量 的 权 
限 ， 其 作用 类 似 于 文件 的 访问 权限 。 此 外 ， 它 们 还 可 以 和 值 IPC_CREAT 做 按 位 或 操作 ， 来 创建 一 个 新 
信号 量 。 即 使 在 设置 了 ITPC_cREAT 标 志 后 给 出 的 键 是 一 个 已 有 信号 最 的 键 ， 也 不 会 产生 错误 。 如 果 函 
数 用 不 到 IPC_CREAT 标 志 ， 该 标志 就 会 被 悄悄 地 忽略 掉 。 我 们 可 以 通过 联合 使 用 标志 IPC_CREAT 和 
IPC_EXcCL 来 确保 创建 出 的 是 一 个 新 的 、 唯 一 的 信号 量 。 如 果 该 信号 量 已 存在 ， 它 将 返回 一 个 错误 。 

semget 函 数 在 成 功 时 返回 一 个 正 数 〈 非 零 ) 值 ， 它 就 是 其 他 信号 量 函数 将 用 到 的 信号 量 标识 符 。 
如 果 失 败 ， 则 返回 -1。 

2. semop 函 数 

semop 函 数 用 于 改变 信号 量 的 值 ， 它 的 定义 如 下 所 示 : 

int semop(int sem id, struct sembuf *sem ops, size t num sem ops); 

第 一 个 参数 sem_id 是 由 semget 返 回 的 信号 量 标识 符 。 第 二 个 参数 sem_ops 是 指向 一 个 结构 数组 的 
指针 ， 每 个 数组 元 素 至 少 包含 以 下 几 个 成 员 : 

struct sembuf ( 

Short sem num; 


short sem op; 
short sem flg; 








) 

第 一 个 成 员 sem_num 是 信号 量 编号 ， 除 非 你 需要 使 用 一 组 信号 量 ， 否 则 它 的 取 值 一 般 为 0。sem_op 
成 员 的 值 是 信号 量 在 一 次 操作 中 需要 改变 的 数值 〈 你 可 以 用 一 个 非 1 的 数值 来 改变 信号 量 的 值 )。 通 常 
只 会 用 到 两 个 值 ， 一 个 是 -1， 也 就 是 p 操 作 ， 它 等 待 信号 量变 为 可 用 ; 一 个 是 +1， 也 就 是 v 操 作 ， 它 发 
送信 号 表示 信号 量 现在 已 可 用 。 

最 后 一 个 成 员 sem_f1g 通 常 被 设置 为 SEM_UNDO。 它 将 使 得 操作 系统 跟踪 当前 进程 对 这 个 信号 量 的 
修改 情况 ， 如 果 这 个 进程 在 没有 释放 该 信号 量 的 情况 下 终止 ， 操 作 系统 将 自动 释放 该 进程 持 有 的 信号 
量 。 除 非 你 对 信号 量 的 行为 有 特殊 的 要 求 ， 否 则 应 该 养 成 设置 sem_f1g 为 SEM_UNDO 的 好 习惯 。 如 果 决 
定 使 用 一 个 非 sEM_UNDo 的 值 , 那 就 一 定 要 注意 保持 设置 的 一 致 性 , 否则 你 很 可 能 会 搞 不 清楚 内 核 是 否 
会 在 进程 退出 时 清理 信号 量 。 

semop 调 用 的 一 切 动作 都 是 一 次 性 完成 的 ， 这 是 为 了 避免 出 现 因 使 用 多 个 信号 量 而 可 能 发 生 的 竞 
争 现象 。semop 的 处 理 细节 可 以 在 手册 页 中 找到 。 
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3. semct1 函 数 
semct1 函 数 用 来 直接 控制 信号 量 信息 ， 它 的 定义 如 下 所 示 : 
int semctl(int sem id, int sem num, int command, ...); 
第 一 个 参数 sem_ia 是 由 semget 返 回 的 信号 量 标识 符 。sem_num 参 数 是 信号 量 编号 ， 当 需要 用 到 成 
组 的 信号 量 时 , 就 要 用 到 这 个 参数 , 它 一 般 取 值 为 0, 表示 这 是 第 一 个 也 是 唯一 的 一 个 信号 量 。commanad 
参数 是 将 要 采取 的 动作 。 如 果 还 有 第 四 个 参数 ， 它 将 会 是 一 个 union semun 结 构 ， 根 据 X/OPEN 规 范 
的 定义 ， 它 至 少 包含 以 下 几 个 成 员 : 
union semun { 
int val; 
struct semid ds *buf; 


unsigned short *array; 
) 


虽然 X/Open 规范 中 指出 ，semun 联 合 结构 必须 由 程序 员 自 己 定义 , 但 大 多 数 Linux 版 本 会 在 某 个 头 
文件 (一般 是 sem.h) 中 给 出 该 结构 的 定义 。 如 果 你 发 现 确 实 需 要 自己 来 定义 该 结构 ， 请 查阅 semct 1 
的 手册 页 ， 看 手册 中 是 否 已 给 出 了 定义 。 如 果 有 ， 我 们 建议 使 用 手册 中 给 出 的 定义 ， 即 使 它 与 这 里 给 
出 的 定义 不 一 致 也 应 该 如 此 。 

semct1 函 数 中 的 command 参 数 可 以 设置 许多 不 同 的 值 ， 但 只 有 下 面 介绍 的 两 个 值 最 常用 。semct1 
函数 的 完整 细节 请 查阅 它 的 手册 页 。 

O sETVAL: 用 来 把 信号 量 初始 化 为 一 个 已 知 的 值 。 这 个 值 通过 union semun 中 的 val 成 员 设置 。 

其 作用 是 在 信号 量 第 一 次 使 用 之 前 对 它 进行 设置 。 

口 IPc_RMID: 用 于 删除 一 个 已 经 无 需 继 续 使 用 的 信号 量 标识 符 。 

semct1 函 数 将 根据 commana 参 数 的 不 同 而 返回 不 同 的 值 。 对 于 sETVAL 和 IPC_RMID, 成 功 时 返回 0， 
失败 时 返回 -1。 


14344 ”使 用 信号 量 


从 上 一 节 的 介绍 可 以 看 出 ， 信 号 量 的 操作 相当 复杂 。 这 可 不 是 一 个 好 消息 ， 因 为 编写 包含 临界 区 
域 的 多 进程 或 多 线程 程序 本 身 就 是 一 件 非 常 困难 的 事情 ， 再 加 上 一 个 如 此 复杂 的 编程 接口 ， 这 就 更 增 
添 了 编程 者 的 精神 负担 。 

幸运 的 是 ， 大 部 分 需要 使 用 信号 量 来 解决 的 问题 只 需 使 用 一 个 最 简单 的 二 进 制 信号 量 即 可 。 在 下 
面 的 例子 中 ,我 们 将 用 完整 的 编程 接口 为 二 进 制 信号 量 创建 一 个 简单 得 多 的 PV 类 型 接口 ,然后 用 这 个 
非常 简单 的 接口 来 演示 信号 量 是 如 何 工作 的 。 

我 们 将 用 程序 seml .c 来 试验 信号 量 , 该 程序 可 以 被 多 次 调用 。 我 们 通过 一 个 可 选 的 参数 来 指定 程 
序 是 负责 创建 信号 量 还 是 负责 删除 信号 量 。 

我 们 用 两 个 不 同 字符 的 输出 来 表示 进入 和 离开 临界 区 域 。 如 果 程 序 启动 时 带 有 一 个 参数 ， 它 将 在 
进入 和 退出 临界 区 域 时 打印 字符 x; 而 程序 的 其 他 运行 实例 将 在 进入 和 退出 临界 区 域 时 打印 字符 0。 因 
为 在 任 一 给 定时 刻 ， 只 能 有 一 个 进程 可 以 进入 临界 区 域 ， 所 以 字符 x 和 o 应 该 是 成 对 出 现 的 。 


信号 量 


(1) 在 包含 了 必需 的 系统 头 文件 之 后 , 我 们 包含 了 头 文件 semun .h。 如 果 系 统 头 文件 sys/sem.h 没 有 定 
义 X/OPEN 规 范 所 需 的 联合 semun， 这 个 头 文件 包含 了 对 它 的 定义 。 然 后 是 函数 原型 的 声明 和 全 局 变量 的 
定义 ， 接 着 就 到 了 main 函 数 的 定义 。 我 们 调用 semget 来 创建 一 个 信号 量 , 该 函数 将 返回 一 个 信号 量 标 
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识 符 。 如 果 程 序 是 第 一 个 被 调用 的 (也 就 是 说 它 在 被 调用 时 带 有 一 个 参数 ， 使 得 argc>1)， 就 调用 


set_semvalue 初 始 化 信号 量 并 将 op_char 设 置 为 x: 


#include <unistd.h> 
#include «stdlib.h» 
#include «stdio.h» 


#include <sys/sem.h> 


#include "semun.h* 


static int set_semvalue (void) ; 
static void del_semvalue (void); 
static int semaphore p(void); 
static int semaphore v(void); 











static int sem id; 


int main(int argc, char *argv[]) 
{ 

int i; 

int pause time; 

char op char = 'O'; 


srand((unsigned int)getpid()); 
sem id - semget((key t)1234, 1, 0666 | IPC CREAT); 


if (argc > 1) ( 
if (!set semvalue()) ( 
fprintf(stderr, "Failed to initialize semaphorein*); 
exit(EXIT FAILURE); 
H 
op_char = 'X'; 
sleep(2); 
) 


(2) 接 下 来 是 一 个 循环 ， 它 进入 和 离开 临界 区 域 10 次 。 在 每 次 循环 的 开始 ， 首 先 调用 semaphore_p 


函数 ， 它 在 程序 将 进入 临界 区 域 时 设置 信号 量 以 等 待 进入 : 
for(i = 0; i < 10; i++) ( 


if (!semaphore p()) exit(EXIT FAILURE); 
printf(*$c*, op char);fflush(stdout); 
pause time - rand() $ 3; 

Sleep(pause time]; 

printf(*$c", op char);fflush(stdout); 


(3) 在 临界 区 域 之 后 ， 调 用 semaphore_v 来 将 信号 量 设置 为 可 用 ， 然 后 等 待 一 段 随机 的 时 间 ， 再 进 


入 下 一 次 循环 。 在 整个 循环 语句 执行 完毕 后 ， 调 用 ael_semvalue 函 数 来 清理 代码 : 
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if (!semaphore v()) exit(EXIT FAILURE); 


pause time - rand() $ 2; 
sleep(pause time); 


printf(*Wn&d - finishedin', getpid()); 


if (argc > 1) ( 
sleep(10); 
del semvalue(); 
) 


exit(EXIT SUCCESS); 


(4) 函数 set_semvalue 通 过 将 semct]1 调 用 的 commana 参 数 设 置 为 servar 来 初始 化 信号 量 。 在 使 用 
信号 量 之 前 必须 要 这 样 做 : 


Static int set semvalue(void) 
union semun sem union; 


sem union.val = 1; 
if (semctl(sem id, 0, SETVAL, sem union) == -1) return(0) ; 
return(1); 


) 


(5) 函数 del_semvalue 的 形式 与 上 面 的 函数 几乎 一 样 ， 只 不 过 它 通过 将 semct1 调 用 的 commana 设 
置 为 TPC_RMID 来 删除 信号 量 ID: 


static void del_semvalue (void) 
{ 
union semun sem_union; 


if (semctl(sem id, 0, IPC RMID, sem union) == -1) 
fprintf(stderr, "Failed to delete semaphore|n'); 
) 


(6) semaphore_p 对 信号 量 做 减 1 操作 〈 等 待 ): 
static int semaphore p(void) 
( 


struct sembuf sem b; 


sem b.sem num = 0; 

sem b.sem op = -1; /* P() */ 

sem b.sem flg - SEM UNDO; 

if (semop(sem id, &sem b, 1) == -1) ( 
fprintf(stderr, "semaphore p failedin*); 
return(0); 

} 

return(1); 
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(7) semaphore_v 和 semaphore_p 类 似 ， 不 同 的 是 它 将 sembuf 结 构 中 的 sem_op 设 置 为 1。 这 是 一 个 
“释放 ”操作 ， 它 使 信号 量变 为 可 用 : 
static int semaphore v(void) 


t 
struct sembuf sem b; 


sem b.sem num = 0; 
sem b.sem op = 1; /* V() */ 
sem b.sem flg = SEM UNDO; 
if (semop(sem id, &sem b, 1) == -1) ( 
fprintf(stderr, "semaphore v failedWn*); 
return(0); 
) 
return(1); 
} 
注意 ， 这 个 简单 的 程序 只 允许 每 个 程序 有 一 个 二 进 制 信号 量 。 虽然 我 们 可 以 通过 传递 信号 量变 量 
的 方法 来 扩展 它 以 支持 更 多 的 信号 量 ， 但 通常 一 个 二 进 制 信号 量 即 已 足够 。 
我 们 可 以 通过 多 次 启动 这 个 程序 的 方法 来 对 它 进行 测试 。 第 一 次 启动 时 加 上 一 个 参数 ， 表 示 应 该 
由 它 来 负责 创建 和 删除 信号 量 。 其 他 的 调用 实例 不 使 用 参数 。 
下 面 是 两 个 程序 调用 实例 时 的 一 些 样本 输出 : 
$ cc seml.c -o semi 
$ ./semi 1 & 
[1] 1082 
$ ./seml 
OOXXOOXXOOXXOOXXOOXXOOOOXXOOXXOOXXOOXXXX. 
1083 - finished 
1082 - finished 
$ 
请 记 住 ， 字 符 “0” 和 “X” 分 别 代表 程序 的 第 一 个 和 第 二 个 调用 实例 。 因 为 每 个 程序 都 在 其 进 
入 和 离开 临界 区 域 时 打印 一 个 字符 ， 所 以 每 个 字符 都 应 该 成 对 出 现 。 如 你 所 见 ， 字 符 o 和 x 是 成 对 出 现 
的 ， 这 表明 对 临界 区 域 的 处 理 是 正确 的 。 如 果 这 个 程序 在 你 的 系统 上 不 能 正常 工作 ， 你 可 能 需要 在 启 
动 程序 之 前 执行 命令 stty -tostop， 以 确保 产生 tty 输 出 的 后 台 程 序 不 会 引发 系统 生成 一 个 信号 。 
实验 解析 
在 程序 的 开始 ， 我 们 用 semget 函数 通过 一 个 (随意 选取 的 ) 键 来 取得 一 个 信号 量 标识 符 。 
IPC_CREAT 标 志 的 作用 是 ， 如 果 信号 量 不 存在 ， 就 创建 它 。 
如 果 程 序 带 有 一 个 参数 ， 它 就 负责 信号 量 的 初始 化 工作 ， 这 是 通过 set_semvalue 函 数 来 完成 的 ， 
该 函数 是 针对 更 通用 的 semct1 函 数 的 简化 接口 。 程 序 还 将 根据 是 否 带 有 参数 来 决定 需要 打印 哪个 字 
符 。sleep 函 数 的 作用 是 ， 让 我 们 有 时 间 在 这 个 程序 实例 执行 太 多 次 循环 之 前 调用 其 他 的 程序 实例 。 
我 们 用 函数 sranda 和 rand 来 为 程序 引入 一 些 伪 随 机 形式 的 时 间 分 配 。 
接 下 来 程序 循环 10 次 ， 在 临界 区 域 和 非 临界 区 域 会 分 别 暂停 一 段 随机 的 时 间 。 临 界 区域 由 
semaphore_p 和 semaphore_v 函 数 前 后 把 守 ， 它 们 是 更 通用 的 semop 函 数 的 简化 接口 。 
删除 信号 量 之 前 ， 带 有 参数 启动 的 程序 会 进入 等 待 状态 ， 以 允许 其 他 调用 实例 都 执行 完毕 。 如 果 
不 删除 信号 量 ， 它 将 继续 在 系统 中 存在 ， 即 使 没有 程序 在 使 用 它 也 是 如 此 。 在 实际 的 编程 中 ， 我 们 需 
要 特别 小 心 ， 不 要 无 意 之 中 在 执行 结束 之 后 还 留 下 信号 量 未 删除 。 它 可 能 会 在 你 下 次 运行 此 程序 时 引 
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发 问题 ， 而 且 信号 量 也 是 一 种 有 限 的 资源 ， 需 要 大 家 节约 使 用 。 


14.2 ”共享 内 存 

共享 内 存 是 3 个 IPC 机 制 中 的 第 二 个 。 它 允许 两 个 不 相关 的 进程 访问 同一 个 逻辑 内 存 
在 两 个 正在 运行 的 进程 之 间 传 递 数据 的 一 种 非常 有 效 的 方式 。 虽 然 X/Open 标 准 并 没 及 
但 大 多 数 共享 内 存 的 具体 实现 ， 都 把 由 不 同 进程 之 间 共享 的 内 存 安排 为 同一 段 物理 内 存 。 

共享 内 存 是 由 IPC 为 进程 创建 的 一 个 特殊 的 地 址 范围 ， 它 将 出 现在 该 进程 的 地 址 空间 中 。 其 他 进 
程 可 以 将 同一 段 共享 内 存 连接 到 它们 自己 的 地 址 空间 中 。 所 有 进程 都 可 以 访问 共享 内 存 中 的 地 址 ， 就 
好 像 它 们 是 由 malloc 分 配 的 一 样 。 如 果 某 个 进程 向 共享 内 存 写 入 了 数据 ， 所 做 的 改动 将 立刻 被 可 以 访 
问 同一 段 共享 内 存 的 任何 其 他 进程 看 到 。 

共享 内 存 为 在 多 个 进程 之 间 共享 和 传递 数据 提供 了 一 种 有 效 的 方式 。 由 于 它 并 未 提供 同步 机 制 ， 
所 以 我 们 通常 需要 用 其 他 的 机 制 来 同步 对 共享 内 存 的 访问 。 我 们 一 般 是 用 共享 内 存 来 提供 对 大 块 内 存 
区 域 的 有 效 访问 ， 同 时 通过 传递 小 消息 来 同步 对 该 内 存 的 访问 。 

在 第 一 个 进程 结束 对 共享 内 存 的 写 操作 之 前 ， 并 无 自动 的 机 制 可 以 阻止 第 二 个 进程 开始 对 它 进 和 
























图 14-2 


图 中 的 箭头 显示 了 每 个 进程 的 未 辑 地 址 空间 到 可 用 物理 内 存 的 映射 关系 。 实 际 情况 要 比 图 中 显示 
的 更 加 复杂 ， 因 为 可 用 内 存 实际 上 由 物理 内 存 和 已 交换 到 磁盘 上 的 内 存 页 面 混合 组 成 。 
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共享 内 存 使 用 的 函数 类 似 于 信号 量 的 函数 ， 它 们 的 定义 如 下 : 
#include <sys/shm.h> 

void *shmat(int shm id, const void *shm addr, int shmflg); 
int shmctl(int shm id, int cmd, struct shmid ds *buf); 
int shmdt(const void *shm addr); 

int shmget(key t key, size t size, int shmflg); 


与 信号 量 的 情况 一 样 ， 头 文件 sys/types.h 和 sys/ipc .h 通 常 被 shm.h 自 动 包含 进程 序 。 
14.2.1 shmget 函数 


我 们 用 shmget 函 数 来 创建 共享 内 存 : 

int shmget(key t key, size t size, int shnflg); 

与 信号 量 一 样 ， 程 序 需 要 提供 一 个 参数 key， 它 有 效 地 为 共享 内 存 段 命名 ，shmget 函数 返回 一 个 
共享 内 存 标识 符 ， 该 标识 符 将 用 于 后 续 的 共享 内 存 函数 。 有 一 个 特殊 的 键 值 TPC_PRIVATE， 它 用 于 创 
建 一 个 只 属于 创建 进程 的 共享 内 存 。 通 常 你 不 会 用 到 这 个 值 ， 而 且 你 可 能 会 发 现在 一 些 Linux 系 统 中 ， 
私有 的 共享 内 存 其 实 并 不 是 真正 的 私有 。 

第 二 个 参数 size 以 字 节 为 单位 指定 需要 共享 的 内 存 容量 。 

第 三 个 参数 shmf1g 包 含 9 个 比特 的 权限 标志 ， 它 们 的 作用 与 创建 文件 时 使 用 的 mode 标 志 一 样 。 由 
IPC_CREAT 定 义 的 一 个 特殊 比特 必须 和 权限 标志 按 位 或 才能 创建 一 个 新 的 共享 内 存 段 。 设 置 
IPC_CREAT 标 志 的 同时 ， 给 shmget 函 数 传递 一 个 已 有 共享 内 存 段 的 键 并 不 是 一 个 错误 ， 如 果 无 需 用 到 
IPC_CREAT 标 志 ， 该 标志 就 会 被 悄悄 地 忽略 掉 。 

权限 标志 对 共享 内 存 非常 有 用 ， 因 为 它们 允许 一 个 进程 创建 的 共享 内 存 可 以 被 共享 内 存 的 创建 者 
所 拥有 的 进程 写 入 ， 同 时 其 他 用 户 创建 的 进程 只 能 读 取 该 共享 内 存 。 我 们 可 以 利用 这 个 功能 来 提供 一 
种 有 效 的 对 数据 进行 只 读 访 问 的 方法 ， 通 过 将 数据 放 入 共享 内 存 并 设置 它 的 权限 ， 就 可 以 避免 数据 被 
其 他 用 户 修改 。 

如 果 共 享 内 存 创建 成 功 ，shmget 返 回 一 个 非 负 整 数 ， 即 共享 内 存 标识 符 ， 如 果 失 败 ， 就 返回 -1。 
14.22 shmat 函数 

第 一 次 创建 共享 内 存 段 时 ， 它 不 能 被 任何 进程 访问 。 要 想 启用 对 该 共享 内 存 的 访问 ， 必 须 将 其 连 
接 到 一 个 进程 的 地 址 空间 中 。 这 项 工作 由 shmat 函 数 来 完成 ， 它 的 定义 如 下 所 示 : 

void *shmat(int shm id, const void *shm addr, int shmflg); 

第 一 个 参数 shm_id 是 由 shmget 返 回 的 共享 内 存 标识 符 。 

第 二 个 参数 shm_adadr 指 定 的 是 共享 内 存 连接 到 当前 进程 中 的 地 址 位 置 。 它 通常 是 一 个 空 指针 , 表 
示 让 系统 来 选择 共享 内 存 出 现 的 地 址 。 

第 三 个 参数 shmf1g 是 一 组 位 标志 。 它 的 两 个 可 能 取 值 是 sHM_RND( 这 个 标志 与 shm_adar 联 合 使 用 ， 
用 来 控制 共享 内 存 连接 的 地 址 ) 和 SHM_RDONLY〔 它 使 得 连接 的 内 存 只 读 )。 我 们 很 少 需要 控制 共享 内 
存 连接 的 地 址 ， 通 常 都 是 让 系统 来 选择 一 个 地 址 ， 否 则 就 会 使 应 用 程序 对 硬件 的 依赖 性 过 高 。 

如 果 shmat 调 用 成 功 ， 它 返回 一 个 指向 共享 内 存 第 一 个 字 节 的 指针 ， 如 果 失 败 ， 它 就 返回 -1。 

共享 内 存 的 读 写 权限 由 它 的 属 主 〈 共 享 内 存 的 创建 者 )、 它 的 访问 权限 和 当前 进程 的 属 主 决定 。 
共享 内 存 的 访问 权限 类 似 于 文件 的 访问 权限 。 

这 个 规则 的 一 个 例外 是 ， 当 shmflg & SHM_RDONLY 为 Erue 时 的 情况 。 此 时 即使 该 共享 内 存 的 访问 
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权限 允许 写 操作 ， 它 都 不 能 被 写 入 。 
14.2.3 shmát 

shmqt 函 数 的 作用 是 将 共享 内 存 从 当前 进程 中 分 离 。 它 的 参数 是 shmat 返 回 的 地 址 指针 。 成 功 时 
它 返 回 9， 失 败 时 返回 -1。 注 意 ， 将 共享 内 存 分 离 并 未 删除 它 ， 只 是 使 得 该 共享 内 存 对 当前 进程 不 再 
可 用 。 
14.24 shmctl 

与 复杂 的 信号 量 控 制 函数 相 比 ， 共 享 内 存 的 控制 函数 (非常 感谢 ) 要 稍微 简单 一 些 。 它 的 定义 如 
下 所 示 : 
int shmctl(int shm id, int command, struct shmid ds *buf); 
shmid_ds 结 构 至 少 包含 以 下 成 员 : 
struct shmid ds ( 

uid t shm perm.uid; 


uid t shm perm.gid; 
mode t shm perm.mode; 












) 
第 一 个 参数 shm_ia 是 shmget 返 回 的 共享 内 存 标识 符 。 
第 二 个 参数 commana 是 要 采取 的 动作 ， 它 可 以 取 3 个 值 ， 如 表 14-2 所 示 。 





表 14-2 
es 
*£ 9 LEE 
IPC.STAT 把 shmid_as 结 构 中 的 数据 设置 为 共享 内 存 的 当前 关联 值 
IPC_SET 如 果 进 程 有 足够 的 权限 ， 就 把 共享 内 存 的 当前 关联 值 设置 为 shmia_ds 结 构 中 给 出 的 值 


IPC RMID 副 除 共享 内 存 段 


第 三 个 参数 buf 是 一 个 指针 ， 它 指向 包含 共享 内 存 模式 和 访问 权限 的 结构 。 

成 功 时 返回 0， 失 败 时 返回 -1。X/Open 规 范 没有 定义 当 你 试图 删除 一 个 正 处 于 连接 状态 的 共享 内 
存 段 时 将 会 发 生 的 情况 。 通 常 这 个 已 经 被 删除 的 处 于 连接 状态 的 共享 内 存 段 还 能 继续 使 用 ， 直 到 它 从 
最 后 一 个 进程 中 分 离 为 止 。 但 因为 这 个 行为 并 未 在 规范 中 定义 ， 所 以 最 好 不 要 依赖 它 。 


Ww 共享 内 存 


介绍 完 共享 内 存 函数 后 ， 我 们 可 以 编写 一 些 代码 来 使 用 它们 。 在 这 个 实验 中 ， 我 们 将 编写 一 对 程 
序 shml .c 和 shm2.c。 第 一 个 程序 (消费 者 ) 将 创建 一 个 共享 内 存 段 ， 然后 把 写 到 它 里 面 的 数据 都 显 
示 出 来 。 第 二 个 程序 (生产 者 ) 将 连接 一 个 已 有 的 共享 内 存 段 ， 并 允许 我 们 向 其 中 输入 数据 。 

(0) 我 们 首先 创建 一 个 公共 的 头 文件 ， 来 定义 我 们 希望 分 发 的 共享 内 存 。 我 们 将 其 命名 为 
shm_com. h: 

#define TEXT SZ 2048 


struct shared use st ( 
int written by you; 
Char some text[TEXT 92]; 
u 
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这 里 定义 的 结构 在 消费 者 和 生产 者 程序 中 都 会 用 到 。 当 有 数据 写 入 这 个 结构 时 ， 我 们 用 该 结构 中 
的 一 个 整 型 标志 written_by_you 来 通知 消费 者 。 需 要 传输 的 文本 长 度 2 KK 是 由 我 们 随意 决定 的 。 

(2) 第 一 个 程序 shml .c 是 消费 者 程序 。 在 头 文件 之 后 ， 通 过 设置 了 IPC_CREAT 标 志 位 的 shmget 调 
用 来 创建 共享 内 存 段 其 长 度 就 是 我 们 的 共享 内 存 结构 的 长 度 ): 

#include <unistd.h> 

#include «stdlib.h» 


#include <stdio.h> 
#include <string.h> 


#include «sys/shm.h» 


#include "shm com.h* 


int main() 


t 


int running = 1; 

void *shared memory = (void *)0; 
struct shared use st *shared stuff; 
int shmid; 


srand((unsigned int)getpid()); 
shmid = shmget((key t)1234, sizeof(struct shared use st), 0666 | IPC CREAT); 
if (shmid == -1) ( 

fprintf(stderr, "shmget failedin'); 


exit(EXIT FAILURE); 
) 


(3) 现在 ， 让 程序 可 以 访问 这 个 共享 内 存 : 


Shared memory = shmat (shmid, (void *)0, 0); 
if (shared memory == (void *)-1) ( 
fprintf (stderr, "shmat failedin*); 
exit(EXIT FAILURE); 
) 


printf ("Memory attached at %X\n", (int)shared memory); 


(4) 程序 的 下 一 部 分 将 shared_memory 分 配给 shared_stuff, 然后 它 输出 written_by_you 中 的 文 
本 。 循 环 将 一 直 执行 到 在 written_by_you 中 找到 ena 字 符 串 为 止 。sleep 调 用 强迫 消费 者 程序 在 临界 
区 域 多 待 一 会 儿 ， 让 生产 者 程序 等 待 : 


shared stuff = (struct shared use st *)shared memory; 
shared stuff-»written by you = 0; 
while(running) ( 
if (shared stuff-»written by you) ( 
printf("You wrote: $s", shared stuff-»some text); 
' sleep( xand() $ 4 ); /* make the other process wait for us ! */ 
shared stuff-»written by you = 
if (strnemp(shared stuff-»some text, *end*, 3) == 0) ( 
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(5) 最 后 ， 共 享 内 存 被 分 离 ， 然 后 被 删除 : 


(6) 第 二 个 程序 shm2 .c 是 生产 者 程序 ， 我 们 通 
程序 代码 如 下 所 示 : 
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shared stuff = (struct shared use st *)shared memory; 
while(running) ( 
while(shared stuff-»written by you == 1) ( 
sleep(1); 
printf(*waiting for client... in"); 
} 
printf ("Enter some text: *); 
fgets(buffer, BUFSIZ, stdin); 


strncpy(shared stuff-»some text, buffer, TEXT SZ); 
Shared stuff-»written by you = 1; 


if (strnemp(buffer, *end*, 3) == 0) ( 
running = 


) 


if (shmdt(shared memory) == -1) ( 
fprintf(stderr, 'shmdt failedWn"); 
exit (EXIT_FAILURE) ; 


) 
exit(EXIT SUCCESS); 
) 


运行 这 些 程序 时 ， 我 们 将 看 到 如 下 所 示 的 样本 输出 : 
$ ./shml & 

[1] 294 

Memory attached at 40017000 
$ ./shm2 

Memory attached at 40017000 
Enter some text: hello 

You wrote: hello 

waiting for client... 
waiting for client... 

Enter some text: Linux! 

You wrote: Linux! 

waiting for client... 
waiting for client... 
waiting for client... 

Enter some text: end 

You wrote: end 





个 程序 shml 创 建 共享 内 存 段 ， 然 后 将 它 连 接 到 自己 的 地 址 空间 中 。 我 们 在 共享 内 存 的 开始 处 
使 用 了 一 个 结构 shared_use_st。 该 结构 中 有 个 标志 written_by_you， 当 共享 内 存 中 有 数据 写 入 时 ， 
就 设置 这 个 标志 。 这 个 标志 被 设置 时 ， 程 序 就 从 共享 内 存 中 读 取 文本 ， 将 它 打 印 出 来 ， 然 后 清除 这 个 
标志 表示 已 经 读 完 数据 。 我 们 用 一 个 特殊 字符 串 ena 来 退出 循环 。 接 下 来 ， 程 序 分 离 共享 内 存 段 并 删 

第 二 个 程序 shm2 使 用 相同 的 键 1234 来 取得 并 连接 同一 个 共享 内 存 段 .然后 它 提示 用 户 输 入 一 些 文 
本 。 如 果 标志 written_by_you 被 设置 ，shm2 就 知道 客户 进程 还 未 读 完 上 一 次 的 数据 ， 因 此 就 继续 等 
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待 。 当 其 他 进程 清除 了 这 个 标志 后 ，shm2 写 入 新 数据 并 设置 该 标志 。 它 还 使 用 字符 串 ena 来 终止 并 分 
离 共享 内 存 段 。 

注意 ， 我 们 只 能 提供 自己 的 、 非 常 简陋 的 同步 标志 written_by_you， 它 包括 一 个 非常 缺乏 效率 
的 忙 等 待 〈 不 停 地 循环 )。 这 可 以 使 得 我 们 的 示例 比较 简单 ， 但 在 实际 编程 中 ， 我 们 应 该 使 用 信号 量 
或 通过 传递 消息 (使 用 管道 或 TPc 消 息 ， 后 者 我 们 在 下 一 节 就 会 谈 到 )、 生 成 信号 (在 第 11 章 介绍 的 》 
的 方法 来 提供 应 用 程序 读 、 写 部 分 之 间 的 一 种 更 有 效率 的 同步 机 制 。 





14.3 ”消息 队列 


我 们 现在 来 学 习 第 三 个 也 是 最 后 一 个 System V IPC 机 制 :消息 队列 (message queue)。 消 息 队列 与 
命名 管道 有 许多 相似 之 处 , 但 少 了 在 打开 和 关闭 管道 方面 的 复杂 性 。 但 使 用 消息 队列 并 未 解决 我 们 在 
使 用 命名 管道 时 过 到 的 一 些 问题 ， 比 如 管道 满 时 的 阻塞 问题 。 

消息 队列 提供 了 一 种 在 两 个 不 相关 的 进程 之 间 传递 数据 的 相当 简单 且 有 效 的 方法 。 与 命名 管道 相 
比 ， 消 息 队列 的 优势 在 于 ， 它 独立 于 发 送 和 接收 进程 而 存在 ， 这 消除 了 在 同步 命名 管道 的 打开 和 关闭 
时 可 能 产生 的 一 些 困难 。 

消息 队列 提供 了 一 种 从 一 个 进程 向 另 一 个 进程 发 送 一 个 数据 块 的 方法 。 而且， 每 个 数据 块 都 被 认 
为 含有 一 个 类 型 ， 接 收 进程 可 以 独立 地 接收 含有 不 同类 型 值 的 数据 块 。 好 消息 是 ， 我 们 可 以 通过 发 送 
i 避免 命名 管道 的 同步 和 阻塞 问题 。 更 好 的 是 ， 我 们 可 以 用 一 些 方法 来 提前 查看 紧急 消 
与 管道 一 样 ， 每 个 数据 块 都 有 一 个 最 大 长 度 的 限制 ， 系 统 中 所 有 队列 所 包含 的 全 部 数 
据 块 的 总 长 度 也 有 一 个 上 限 。 

虽然 X/Open 规 范 说 明 这 些 限制 是 强制 的 ， 但 它 并 未 提供 发 现 这 些 限制 的 方法 ， 只 是 告诉 我 们 超过 
这 些 限制 是 引起 一 些 消息 队列 函数 失败 的 原因 之 一 。Linux 系 统 有 两 个 宏 定义 MsSGMAX 和 MscMNB， 它 们 
以 字 节 为 单位 分 别 定义 了 一 条 消息 的 最 大 长 度 和 一 个 队列 的 最 大 长 度 。 其 他 系统 中 的 这 些 宏 定义 可 能 
会 不 一 样 或 甚至 根本 就 不 存在 。 

消息 队列 函数 的 定义 如 下 所 示 : 


#include «sys/msg.h» 











int msgctl(int msqid, int cmd, struct msqid ds *buf); 

int msgget(key t key, int msgflg); 

int msgrcv(int msqid, void *msg ptr, size t msg sz, long int msgtype, int msgflg); 
int msgsnd(int msqid, const void *msg ptr, size t msg sz, int msgflg); 


与 信号 量 和 共享 内 存 一 样 ， 头 文件 sys/cypes.h 和 sys/ipc.h 通 常 被 neg.h 自 动 包含 进程 序 。 
14.3.1 msgget 函数 


我 们 用 msgget 函 数 来 创建 和 访问 一 个 消息 队列 : 

int msgget(key t key, int msgflg); 

与 其 他 IPC 机 制 一 样 , 程序 必须 提供 一 个 键 值 来 命名 某 个 特定 的 消息 队列 。 特殊 键 值 ITPC_PRIVATE 
用 于 创建 私有 队列 ,从 理论 上 来 说 , 它 应 该 只 能 被 当前 进程 访问 , 但 同 信号 量 和 共享 内 存 的 情况 一 样 ， 
消息 队列 在 某 些 Linux 系 统 中 事实 上 并 非 私 有 。 由 于 私有 队列 没有 什么 用 处 ， 所 以 这 并 不 是 一 个 很 严 
重 的 问题 。 与 以 前 一 样 ， 第 二 个 参数 msgf1g 由 9 个 权限 标志 组 成 。 由 IPC_CREAT 定 义 的 一 个 特殊 位 必 
须 和 权限 标志 按 位 或 才能 创建 一 个 新 的 消息 队列 。 在 设置 ITPC_CREar 标 志 时 ， 如 果 给 出 的 是 一 个 已 有 
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消息 队列 的 键 也 不 会 产生 错误 。 如 果 消息 队列 已 有 ， 则 IPC_CREAT 标 志 就 被 悄悄 地 忽略 掉 。 
成 功 时 msgget 函 数 返回 一 个 正 整数 ， 即 队列 标识 符 ， 失 败 时 返回 -1。 


14.3.2 msgsna 函数 
msgsnd 函 数 用 来 把 消息 添加 到 消息 队列 中 : 


int msgsnd(int msqid, const void *msg ptr, size t msg sz, int msgflg); 

消息 的 结构 受到 两 方面 的 约束 。 首 先 ， 它 的 长 度 必 须 小 于 系统 规定 的 上 限 ， 其 次 ， 它 必须 以 一 个 
长 整 型 成 员 变量 开始 ， 接 收 函 数 将 用 这 个 成 员 变 量 来 确定 消息 的 类 型 。 当 使 用 消息 时 ， 最 好 把 消息 结 
构 定义 为 下 面 这 样 : 


struct my message ( 

long int message type; 

/* The data you wish to transfer */ 
) 


由 于 在 消息 的 接收 中 要 用 到 message_type， 所 以 你 不 能 忽略 它 。 你 必须 在 声明 自己 的 数据 结构 
时 包含 它 ， 并 且 最 好 将 它 初始 化 为 一 个 已 知 值 。 

第 一 个 参数 msaid 是 由 msgget 函 数 返回 的 消息 队列 标识 符 。 

第 二 个 参数 msg_ptr 是 一 个 指向 准备 发 送 消息 的 指针 ， 消 息 必 须 像 刚才 说 的 那样 以 一 个 长 整 型 成 
员 变 量 开始 。 

第 三 个 参数 msg_sz 是 msg_ptr 指 向 的 消息 的 长 度 。 这 个 长 度 不 能 包括 长 整 型 消息 类 型 成 员 变量 的 
长 度 。 

第 四 个 参数 msgf1g 控 制 在 当前 消息 队列 满 或 队列 消息 到 达 系 统 范 围 的 限制 时 将 要 发 生 的 事情 ,如 
果 msgflg 中 设置 了 IPC_NOWAIT 标 志 ， 函 数 将 立刻 返回 ， 不 发 送 消息 并 且 返 回 值 为 -1。 如 果 msgf1g 中 
的 IPC_NOWAIT 标 志 被 清除 ， 则 发 送 进程 将 挂 起 以 等 待 队列 中 腾 出 可 用 空间 。 

成 功 时 这 个 函数 返回 9, 失败 时 返回 -1。 如 果 调 用 成 功 , 消息 数据 的 一 份 副本 将 被 放 到 消息 队列 中 。 


14.8.3 msgrcv 函数 
msgrcv 函 数 从 一 个 消息 队列 中 获取 消息 : 


int msgrcv(int msqid, void *msg ptr, size t msg sz, long int msgtype, int msgflg); 

第 一 个 参数 msaqid 是 由 msgget 函 数 返回 的 消息 队列 标识 符 。 

第 二 个 参数 msg_ptr 是 一 个 指向 准备 接收 消息 的 指针 ， 消 息 必须 像 前 面 mnsgsnd 函 数 中 介绍 的 那样 
以 一 个 长 整 型 成 员 变 量 开 始 。 

第 三 个 参数 msg_sz 是 msg_ptr 指 向 的 消息 的 长 度 ， 它 不 包括 长 整 型 消息 类 型 成 员 变 量 的 长 度 。 

第 四 个 参数 msgtype 是 一 个 长 整数 ， 它 可 以 实现 一 种 简单 形式 的 接收 优先 级 。 如 果 msgcype 的 值 
为 0， 就 获取 队列 中 的 第 一 个 可 用 消息 。 如 果 它 的 值 大 于 零 ， 将 获取 具有 相同 消息 类 型 的 第 一 个 消息 。 
如 果 它 的 值 小 于 零 ， 将 获取 消息 类 型 等 于 或 小 于 msgtype 的 绝对 值 的 第 一 个 消息 。 

这 个 函数 看 起 来 好 像 很 复杂 ， 但 实际 应 用 时 很 简单 。 如 果 只 想 按照 消息 发 送 的 顺序 来 接收 它们 ， 
就 把 msgtype 设 置 为 0。 如 果 只 想 获取 某 一 特定 类 型 的 消息 ， 就 把 msgtype 设 置 为 相应 的 类 型 值 。 如 果 
想 接收 类 型 等 于 或 小 于 n 的 消息 ， 就 把 msgtype 设 置 为 -n。 

第 五 个 参数 msgf1g 用 于 控制 当 队列 中 没有 相应 类 型 的 消息 可 以 接收 时 将 发 生 的 事情 。 如 果 
msgf1lg 中 的 IPC_NOWAIT 标 志 补 设置， 函数 将 会 立刻 返回 ,返回 值 是 -1。 如 果 msgf1g 中 的 IPC_NOWAIT 
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标志 被 清除 ， 进 程 将 会 挂 起 以 等 待 一 条 相应 类 型 的 消息 到 达 。 
成 功 时 msgrcv 函 数 返回 放 到 接收 缓存 区 中 的 字 节 数 ， 消 息 被 复制 到 由 msg_ptr 指 向 的 用 户 分 配 的 
缓存 区 中 ， 然 后 删除 消息 队列 中 的 对 应 消息 。 失 败 时 返回 -1。 


14.3.4 msgctl 函数 
最 后 一 个 消息 队列 函数 是 msgcr1， 它 的 作用 与 共享 内 存 的 控制 函数 非常 相似 : 


int msgctl(int msqid, int command, struct msqid ds *buf); 
msqid_ds 结 构 至 少 包含 以 下 成 员 ; 
struct msqid ds { 
uid t msg perm.uid; 
uid t msg perm.gid 
mode t msg perm.mode; 
) 


第 一 个 参数 msqid 是 由 msgget 返 回 的 消息 队列 标识 符 。 
第 二 个 参数 commana 是 将 要 采取 的 动作 。 它 可 以 取 3 个 值 ， 如 表 14-3 所 示 。 
表 14-3 
说 明 
把 msqid_qs 结 构 中 的 数据 设置 为 消息 队列 的 当前 关联 值 
如 果 进 程 有 足够 的 权限 ， 就 把 消息 队列 的 当前 关联 值 设置 为 msqia_as 结 构 中 给 出 的 什 
IPC_RMID Bn ABI 
成 功 时 它 返 回 9， 失 败 时 返回 -1。 如 果 删 除 消息 队列 时 ， 某 个 进程 正在 msgsna 或 msgrcv 函 数 中 等 
待 ， 这 两 个 函数 将 失败 。 


EE sew 

介绍 完 消 息 队列 的 定义 后 ， 我 们 来 看 它 的 实际 工作 情况 。 与 前 面 一 样 ， 我 们 将 编写 两 个 程序 : 
msg1.c 用 于 接收 消息 ，msg2.c 用 于 发 息 。 我 们 将 允许 两 个 程序 都 可 以 创建 消息 队列 ， 但 只 有 接 
收 者 在 接收 完 最 后 一 个 消息 之 后 可 以 嗣 除 它 。 

(D 下 面 是 接收 者 程序 msg1.c 的 代码 : 

finclude <stdlib.h> 

#include <stdio.h> 

#include <string.h> 

#include «errno.h» 

#include <unistd.h> 














#include <sys/msg.h> 


struct my msg st ( 
long int my msg type; 
Char some text[BUFSIZ] ; 
E 
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int main() 
{ 





int running 
int msgid; 
struct my msg st some data; 
long int msg to receive - 0; 


(2) 首先 建立 消息 队列 : 
msgid = msgget((key t)1234, 0666 | IPC CREAT); 


dt 


if (msgid == -1) ( 
fprintf(stderr, "msgget failed with error: $&din*, errno); 
exit(EXIT FAILURE); 

Y 


(3) 然后 从 队列 中 获取 消息 ， 直 到 遇见 ena 消 息 为 止 。 最 后 ， 删 除 消息 队列 : 


while(running) { 
if (msgrcv(msgid, (void *)&some data, BUFSIZ, 
msg to receive, 0) == -1) ( 
fprintf(stderr, "msgrcv failed with error: %d\n", errno); 
exit(EXIT FAILURE); 
} 
printf(*You wrote: %s", some data.some text); 
if (strncmp(some data.some text, *end*, 3) == 0) ( 
running = 0; 
) 
) 


if (msgctl(msgid, IPC RMID, 0) == -1) ( 
fprintf(stderr, "msgctl(IPC RMID) failedin*); 
exit(EXIT, FAILURE); 

) 


exit(EXIT SUCCESS); 

) 

(4) 发 送 者 程序 msg2 .< 与 msgl .c 很 相似 。 在 main 函 数 的 变量 定义 部 分 , 删除 了 对 msg_to_receive 
的 定义 并 把 它 痊 换 为 buffer [BUFSIZ] 。 去 掉 删 除 消息 队列 的 语句 ， 在 running 循 环 中 做 如 下 的 改动 。 
我 们 现在 通过 调用 msgsna 来 发 送 用 户 输入 的 文本 到 消息 队列 中 。 下 面 是 msg2 .c 的 代码 ， 阴 影 部 分 是 
与 msgl .c 不 同 的 地 方 : 

#include <stdlib.h> 

#include <stdio.h> 

#include <string.h> 


#include <errno.h> 
finclude <unistd.h> 


#include <sys/msg.h> 
#define MAX_TEXT 512 


struct my_msg_st { 
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long int my msg type; 
char some text[MAX TEXT]; 


int main() 


int running = 1; 

struct my msg st some data; 
int msgid; 

char buffer[BUFSIZ] ; 


msgid - msgget((key t)1234, 0666 | IPC CREAT); 


if (msgid == -1) ( 
fprintf(stderr, "msgget failed with error: %d\n", errno); 
exit(EXIT FAILURE); 

) 


while(running) { 
printf(*Enter some text: *); 
fgets(buffer, BUFSIZ, stdin); 
Some data.my msg type = 1; 
Strcpy(some data.some text, buffer); 


if (msgsnd(msgid, (void *)&some data, MAX TEXT, 0) == -1) ( 
fprintf(stderr, "msgsnd failedWn*); 


exit(EXIT FAILURE); 

) 

if (strncmp(buffer, "end", 3) == 0) ( 
running = 0; 


) 
) 


exit(EXIT SUCCESS) ; 

) 

与 管道 例子 不 同 ， 这 里 不 再 需要 由 进程 自己 来 提供 同步 方法 。 这 是 消息 相对 于 管道 的 一 个 明显 优 
势 。 

假设 消息 队列 中 有 空间 ， 发 送 者 可 以 创建 队列 ， 放 一 些 数据 到 队列 中 ， 然 后 在 接收 者 启动 之 前 就 
退出 。 我 们 将 先 运行 发 送 者 msg2。 下 面 是 一 些 样本 输出 : 

$ ./msg2 

Enter some text: hello 

Enter some text: How are you today? 

Enter some text: end 

$ ./msgi 

You wrote: hello 

You wrote: How are you today? 

You wrote: end 


$ 
发 送 者 程序 通过 msgget 来 创建 一 个 消息 队列 ,然后 用 msgsna 向 队列 中 增加 消息 .接收 者 用 msgget 
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获得 消息 队列 标识 符 ， 然 后 开始 接收 消息 ， 直 到 接收 到 特殊 的 文本 ena 为 止 。 然 后 它 用 msgct1 来 删除 
消息 队列 以 完成 清理 工作 。 
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现在 ， 我 们 可 以 用 在 本 章 中 学 到 的 IPC 机 制 来 修改 CD 数据 库 应 用 程序 了 。 

我 们 可 以 使 用 这 3 种 IPC 机 制 的 不 同 组 合 方式 , 但 考虑 到 需要 传递 的 消息 非常 小 ， 所 以 直接 使 用 消 
息 队 列 来 实现 请 求 和 响应 的 传递 应 该 是 比较 合乎 情理 的 。 

如 果 需 要 传递 的 数据 量 很 大 ， 我 们 就 可 以 考虑 用 共享 内 存 来 传递 实际 数据 ， 再 用 信号 量 或 消息 来 
传递 一 个 “ 令 牌 ”去 通知 其 他 进程 共享 内 存 中 的 数据 已 可 用 。 

消息 队列 的 接口 省 去 了 我 们 在 第 11 章 中 遇 到 的 问题 ， 那 时 我 们 需要 在 数据 传递 过 程 中 两 个 进程 都 
打开 管道 。 使 用 消息 队列 允许 一 个 进程 往 队列 中 放 消息 ， 即 使 这 个 进程 是 当前 该 队列 的 唯一 用 户 。 

唯一 需要 我 们 做 出 的 重要 决定 是 如 何 向 客户 返回 查询 结果 。 一 种 简单 的 做 法 是 让 服务 器 用 一 个 队 
列 ， 每 个 客户 用 一 个 队列 。 但 如 果 并 发 客户 数 太 大 ， 这 将 引起 问题 ， 因 为 需要 大 量 的 消息 队列 。 通 过 
使 用 消息 中 的 消息 ID 域 ， 就 可 以 允许 所 有 客户 只 使 用 一 个 队列 。 通 过 在 消息 中 使 用 客户 进程 ID， 就 可 
以 把 响应 消息 和 特定 的 客户 进程 联系 起 来 。 然 后 ， 每 个 客户 可 以 只 获取 那些 发 送 给 它 的 消息 ， 而 将 发 
送 给 其 他 客户 的 消息 留 在 队列 中 。 

要 想 把 我 们 的 CD 数据 库 应 用 程序 转换 为 使 用 IPC 机 制 ， 只 需要 更 换 第 13 章 代码 中 的 文件 
pipe_imp.c。 在 以 下 儿 页 内 容 中 ， 我 们 将 介绍 替换 文件 ipc_imp.c 中 的 核心 代码 。 
14.4.1 修改 服务 器 函数 

首先 ， 需 要 更 新 服务 器 函数 。 

(1) 首先 ， 包 括 必要 的 头 文件 ， 声 明 一 些 消息 队列 的 键 ， 然 后 定义 一 个 用 来 保存 消息 数据 的 结构 : 


#include "cd data.h* 
#include "cliserv.h* 


finclude «sys/msg.h» 


#define SERVER MQUEUE 1234 
#define CLIENT MQUEUE 4321 


struct msg passed ( 
long int msg key; /* used for client pid */ 
message db t real message; 


J; 
(2) 两 个 文件 范围 的 变量 分 别 保存 msgget 函 数 返 回 的 两 个 队列 标识 符 : 


static int serv_qid = -1; 
static int cli gid = -1; 


(3) 我 们 让 服务 器 负责 创建 两 个 消息 队列 : 
int server starting() 
t 


fif DEBUG TRACE 
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printf(*td :- server_starting()\n*, getpid()); 
#endif 


Serv qid = msgget((key t)SERVER MQUEUE, 0666 | IPC CREAT); 
if (serv qid == -1) return(0); 


Cli qid = msgget((key t)CLIENT MQUEUE, 0666 | IPC CREAT); 
if (cli gid == -1) return(0); 


return(1); 
小 


(4) 服务 器 还 负责 在 退出 时 执行 清理 工作 。 服 务 器 结束 时 ， 我 们 将 文件 范围 的 变量 设置 为 无 效 值 。 
当 服务 器 在 调用 了 server_ending 后 还 试图 发 送 消息 时 ， 这 种 做 法 可 以 捕获 到 这 样 的 错误 。 


void server ending() 
{ 
#if DEBUG_TRACE 
Printf("%d :- server_ending()\n", getpid()); 
#endif 


(void)msgctl(serv qid, IPC RMID, 0); 
(void)msgctl(cli qid, IPC RMID, 0); 


serv qid = -1; 
cli qid = -1; 
) 


(5) 服务 器 读 函 数 的 作用 是 : 从 队列 中 读 取 一 个 任 一 类 型 〈 即 来 自任 意 客户 ) 的 消息 ， 返 回 消息 
的 数据 部 分 (忽略 消息 的 类 型 ): 


int read request. from client(message db t *rec ptr) 
{ 


struct msg_passed my_msg; 
#if DEBUG TRACE 

printf(*&d :- read request from client()\n"*, getpid()); 
#endif 


if (msgrcv(serv qid, (void *)&my msg, sizeof(*rec ptr), 0, 0) == -1) ( 
return(0); 
H 
*rec ptr - my msg.real message; 
return(1); 
} 


(6) 发 送 响应 时 ， 用 客户 进程 ID 来 编 址 消息 ， 客 户 进程 ID 存 放 在 客户 的 请 求 中 : 


int send resp to client(const message db t mess to send) 
{ 
struct msg passed my msg; 
*if DEBUG TRACE 
printf(*$d :- send resp to client()An', getpid()); 
dendif 


my msg.real message - mess to send; 
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my_msg.msg_key = mess to send.client pid; 


if (msgsnd(cli qid, (void *)&my msg, sizeof(mess to send), 0) == -1) ( 
return(0); 
) 
return(1); 
Y 


144.2 ”修改 客户 函数 


接着 ， 修 改 客户 函数 。 

(1) 当 客 户 启动 时 ， 它 需要 找到 服务 器 和 客户 队列 标识 符 。 客 户 本 身 并 不 创建 队列 。 如 果 服 务 器 
没有 运行 ， 这 个 函数 就 会 因 消息 队列 不 存在 而 失败 。 

int client, starting() 


#if DEBUG TRACE 
printf(*$d :- client starting n*, getpid()); 
tendif 


serv qid = msgget((key t)SERVER MQUEUE, 0666); 
if (serv gid == -1) return(0); 


cli qid = msgget((key t)CLIENT MQUEUE, 0666); 
if (cli qid == -1) return(0); 
return(1); 
) 
Q) 与 服务 器 一 样 ， 当 客户 结束 时 ， 我 们 将 文件 范围 的 变量 设置 为 无 效 值 。 客 户 在 调用 了 
client_ending 之 后 还 试图 发 送 消息 时 ， 这 种 做 法 就 可 以 捕获 到 这 样 的 错误 。 
void client. ending() 
{ 
#if DEBUG_TRACE 
printf(*&d :- client_ending()\n"， getpid()); 
#endif 





serv_qid = -1; 
cli qid = -1; 
} 
(3) 为 了 发 送 消息 给 服务 器 ， 将 数据 存储 到 我 们 的 结构 中 。 注 意 ， 我 们 必须 设置 消息 的 键 。 因 为 0 
对 键 来 说 是 个 无 效 值 ， 而 如 果 不 对 这 个 键 做 定义 就 意味 着 它 将 取 一 个 (显然 的 ) 随机 值 ， 如 果 碰 巧 这 
个 值 是 0 的 话 ， 这 个 函数 就 会 调用 失败 。 
int send_mess_to_server (message_db_t mess to send) 
t 
struct msg passed my msg; 
*if DEBUG TRACE 
printf('&d :- send mess to server()Wn*, getpid(]); 
fendif 





my msg.real message = mess to send; 
my msg.msg key = mess to send.client pid; 
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if (msgsnd(serv qid, (void *)&my msg, sizeof(mess to send), 0) == -1) ( 
perror('Message send failed"); 
return(0); 


) 
return(1); 
) 


(4) 当 客户 从 服务 器 获取 一 个 消息 时 ， 它 用 自己 的 进程 ID 来 只 接收 发 送 给 它 的 消息 ， 而 忽略 发 送 
给 其 他 客户 的 消息 。 


int read resp from server(message db t *rec ptr) 
{ 
struct msg_passed my_msg; 
#if DEBUG_TRACE 
printf("%d :- read resp from server()\n", getpid()); 


tendit 

if (msgrcv(cli qid, (void *)&my msg, sizeof(*rec ptr), getpid(), 0) == -1) ( 
return(0); 

) 

*rec ptr = my msg.real message; 

return(1); 


) 


(5) 为 了 保持 与 pipe_imp.c 的 完全 兼容 我们 还 需要 定义 4 个 函数 。 但 在 新 程序 中 ,这些 函 数 是 空 
的 ， 因 为 现在 已 经 不 再 需要 它们 在 使 用 管道 时 实现 的 操作 了 。 

int start resp to client(const message db t mess to send) 

t 


return(1); 


) 


void end resp to client(void) 
t 
) 


int start resp from server(void) 
t 

return(1); 
) 


void end resp from server(void) 
t 
) 


我 们 现在 可 以 启动 服务 器 ， 它 在 后 台 完成 实际 的 数据 存储 和 检索 。 然 后 运行 客户 程序 ， 它 通过 消 
息 连接 服务 器 。 

我 们 在 这 里 所 需要 做 的 就 是 将 第 11 章 中 的 接口 函数 替换 为 使 用 消息 队列 的 实现 。 将 应 用 程序 转换 
为 使 用 消息 队列 展示 了 IPC 消 息 队 列 的 强大 。 因 为 与 使 用 管道 的 程序 相 比 ， 我 们 需要 使 用 的 函数 更 少 
了 ， 即 使 那些 仍然 需要 使 用 的 函数 也 比 它们 以 前 的 实现 版 本 要 简单 得 多 。 
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14.5 1IPC 状态 命令 


虽然 X/Open 规 范 并 没有 定义 它们 ， 但 大 多 数 Linux 系 统 都 提供 了 一 组 命令 ， 用 于 从 命令 行 上 访问 
IPC 信 息 以 及 清理 游离 的 IPC 机 制 。 它们 是 ipcs 和 ipcrm 命 令 ， 这 两 个 命令 对 于 开发 程序 非常 有 用 。 

IPC 机 制 一 个 让 人 烦恼 的 问题 是 : 编写 错误 的 程序 或 因为 某 些 原因 而 执行 失败 的 程序 将 把 它 的 IPC 
资源 (如 消息 队列 中 的 数据 ) 遗留 在 系统 中 , 并 且 这 些 资源 在 程序 结束 后 很 长 时 间 仍 然 在 系统 中 游荡 。 
这 将 导致 对 程序 的 新 调用 执行 失败 ， 因 为 程序 期 望 以 一 个 干净 的 系统 来 启动 ， 但 事实 上 却 发 现 一 些 遗 
留 的 资源 。 状 态 命令 (ipcs) 和 删除 命令 (ipcrm) 提供 了 一 种 检查 和 清理 IPC 机 制 的 方法 。 


14.51 显示 信号 量 状态 

要 检查 系统 中 信号 量 的 状态 ， 可 以 使 用 命令 ipcs -s。 如 果 系统 中 有 信号 量 存在 ， 就 会 给 出 如 下 
格式 的 输出 : 

$ ./ipes -s 

endana Semaphore Arrays -------- 


key semid owner perms nsems 
0x4d00dfla 768 rick 666 1 
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量 ， 使 用 的 命令 〈 在 Linux 系 统 中 ) 如 下 所 示 : 

$ ./ipcrm -s 768 

- 些 非常 老 的 Linux 系 统 使 用 一 个 稍微 不 同 的 命令 语法 : 

$ ./ipcrm sem 768 

但 这 种 命令 语法 现在 已 很 少 使 用 。 请 查看 系统 手册 页 来 确定 在 你 的 特定 系统 中 应 该 使 用 的 正确 语 
法 格式 。 
14.5.2 ”显示 共享 内 存 状态 

类 似 于 信号 量 ， 许 多 系统 提供 了 命令 行程 序 来 访问 共享 内 存 的 细节 情况 。 它 们 是 命令 ipcs -m 和 


ipcrm -m <id> (或 ipcrm shm <id>)。 


下 面 是 一 些 ipcs -m 命 令 的 样本 输出 : 


$ ipes -m 

I Shared Memory Segments -------- 

key shmid ^ owner perms bytes nattch status 
0x00000000 384 rick 666 4096 2 dest 


这 里 显示 的 是 一 个 长 度 为 4 KB 的 共享 内 存 段 ， 它 被 两 个 进程 连接 。 

ipcrm -m <id> 命 令 的 作用 是 删除 共享 内 存 。 如 果 程 序 因 运行 失败 而 未 清理 共享 内 存 ， 这 个 命令 
就 很 有 用 了 。 
14.5.3 ”显示 消息 队列 状态 


用 于 消息 队列 的 命令 是 ipcs -gq 和 ipcrm -q «id» (或 ipcrm msg <id>)。 
下 面 是 命令 ipcs -q 的 一 些 样本 输出 : 
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$ ipes -q 

T Message Queues -------- 

key msgid owner perms used-bytes messages 
0x000004d2 3384 rick 666 2048 2 


这 显示 了 两 个 消息 ， 在 消息 队列 中 的 总 长 度 为 2 048 个 字 节 。 
ipcrm -q <id> 命 令 用 于 删除 一 个 消息 队列 。 


14.6 小 结 


在 本 章 中 , 我 们 介绍 了 3 种 进程 间 通 信 的 机 制 , 它们 最 早出 现在 UNIX System V2 版 本 中 , 并 从 Linux 
的 早期 版 本 开始 就 已 可 用 。 这 些 机 制 是 信号 量 、 共 享 内 存 和 消息 队列 。 我 们 介绍 了 它们 所 提供 的 复杂 
功能 以 及 这 些 功能 是 如 何 提供 的 。 一 旦 我 们 理解 了 这 些 功 能 ， 它 们 就 可 以 为 许多 进程 间 通 信 的 需求 提 
供 强 有 力 的 解决 方案 。 
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章 中 ， 我 们 将 介绍 进程 间 通 信 的 另 一 种 方法 ， 与 我 们 在 第 13、14 章 讨论 的 方法 相 比 ， 它 
i 着 明显 的 不 同 。 到 目前 为 止 ， 我 们 讨论 的 所 有 机 制 都 依靠 一 台 计 算 机 系统 的 共享 资源 实 
现 。 这 里 的 资源 可 以 是 文件 系统 空间 、 共 享 的 物理 内 存 或 消息 队列 ， 但 只 有 运行 在 同一 台 机 器 上 的 进 
程 才能 使 用 它们 。 

伯克利 版 本 的 UNIX 系 统 引 入 了 一 种 新 的 通信 工具 一 一 套 接 字 接口 (socket interface)， 它 是 我 们 在 
第 13 章 介绍 的 管道 概念 的 一 个 扩展 。Linux 系 统 支持 套 接 字 接 口 。 你 可 以 通过 与 使 用 管道 类 似 的 方法 
来 使 用 套 接 字 ， 但 套 接 字 还 包括 了 计算 机 网 络 中 的 通信 。 一 台 机 器 上 的 进程 可 以 使 用 套 接 字 和 另外 
台 机 器 上 的 进程 通信 ,， 这样 就 可 以 支持 分 布 在 网 络 中 的 客户 /服务 器 系统 。 同 一 台 机 器 上 的 进程 之 问 也 
可 以 使 用 套 接 字 进 行 通信 。 

此 外 ， 微 软 的 Windows 系 统 也 通过 可 公开 获取 的 Windows Sockets 技 术 规 范 (简称 WinSock) 实现 
了 套 接 字 接口 。Windows 系 统 的 套 接 字 服 务 是 由 系统 文件 winsock.al1 来 提供 的 ， 因 此 ，Windows 程 
序 可 以 通过 网 络 和 Linux/UNIX 计 算 机 进行 通信 来 实现 客户 /服务 器 系统 ， 反 之 亦 然 。 虽然 WinSock 的 编 
程 接口 和 UNIX 套 接 字 不 尽 相同 ， 但 它 同样 是 以 套 接 字 为 基础 的 。 

Linux 丰 富 的 网 络 功能 不 可 能 只 用 一 章 的 篇 幅 就 完全 涵盖 ， 所 以 我 们 将 在 本 章 中 对 主要 的 网 络 编 
程 接口 进行 介绍 。 掌 握 了 本 章 的 内 容 后 ， 你 就 可 以 开始 编写 自己 的 网 络 程序 了 。 我 们 将 主要 介绍 下 面 
的 内 容 : 

O 套 接 字 连接 的 工作 原理 

口 套 接 字 的 属性 、 地 址 和 通信 

O 网 络 信息 和 互联 网 守护 进程 (ineta/xineta) 

口 客户 和 服务 器 


15.1 什么 是 套 接 字 


deb T (sockeD 是 一 种 通信 机 制 ， 凭 借 这 种 机 制 ， 客 户 /服务 器 系统 的 开发 工作 既 可 以 在 本 地 单 
机 上 进行 ， 也 可 以 跨 网 络 进行 。Linux 所 提供 的 功能 (如 打印 服务 、 连 接 数据 库 和 提供 Web 页 面 ) 和 网 
络 工具 (如 用 于 远程 登录 的 rlogin 和 用 于 文件 传输 的 ftp) 通常 都 是 通过 套 接 字 来 进行 通信 的 。 

套 接 字 的 创建 和 使 用 与 管道 是 有 区 别 的 ， 因 为 套 接 字 明确 地 将 客户 和 服务 器 区 分 开 来 。 套 接 字 机 
制 可 以 实现 将 多 个 客户 连接 到 一 个 服务 器 - 


15.2” 套 接 字 连 接 
你 可 以 把 套 接 字 连接 想象 为 打 电 话 进 一 个 繁忙 的 办 公 大 楼 。 一 个 电话 打 到 一 家 公司 ， 接 线 员 接听 
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电话 并 把 它 转 到 正确 的 部 门 《 服 务 器 进程 )， 然 后 再 从 那里 转 到 电话 要 找 的 人 (服务 器 套 接 字 )。 每 个 
进入 的 电话 呼叫 《客户 ) 都 被 转 到 正确 的 终端 节点 ， 而 中 间 介入 的 接线 员 则 可 以 空 出 来 处 理 后 续 的 电 
话 。 在 开始 学 习 Linux 系 统 中 的 套 接 字 连 接 是 如 何 建立 之 前 ， 我 们 需要 先 理解 套 接 字 应 用 程序 是 如 何 
通过 套 接 字 来 维持 一 个 连接 的 。 

首先 ， 服 务 器 应 用 程序 用 系统 调用 sockec 来 创建 一 个 套 接 字 , 它 是 系统 分 配给 该 服务 器 进程 的 类 
似 文件 描述 符 的 资源 ， 它 不 能 与 其 他 进程 共享 。 

接 下 来 ， 服 务 器 进程 会 给 套 接 字 起 个 名 字 。 本 地 套 接 字 的 名 字 是 Linux 文 件 系统 中 的 文件 名 ， 
般 放 在 /tmp 或 /usr/tmp 目 录 中 。 对 于 网 络 套 接 字 ， 它 的 名 字 是 与 客户 连接 的 特定 网 络 有 关 的 服务 标 
识 符 〈 端 口号 或 访问 点 )。 这 个 标识 符 允 许 Linux 将 进入 的 针对 特定 端口 号 的 连接 转 到 正确 的 服务 器 进 
程 。 例 如 ，Web 服 务 器 一 般 在 80 端 口上 创建 一 个 套 接 字 ， 这 是 一 个 专用 于 此 目的 的 标识 符 。Web 浏 览 
器 知道 对 于 用 户 想 要 访问 的 Web 站 点 ， 应 该 使 用 端口 80 来 建立 HTTP 连 接 。 我 们 用 系统 调用 bina 来 给 
套 接 字 命名 。 然 后 服务 器 进程 就 开始 等 待 客户 连接 到 这 个 命名 套 接 字 。 系 统 调用 1isten 的 作用 是 ， 创 
建 一 个 队列 并 将 其 用 于 存放 来 自 客户 的 进入 连接 。 服 务 器 通过 系统 调用 accept 来 接受 客户 的 连接 。 

服务 器 调用 accept 时 , 它 会 创建 一 个 与 原 有 的 命名 套 接 字 不 同 的 新 套 接 字 。 这 个 新 套 接 字 只 用 
于 与 这 个 特定 的 客户 进行 通信 ， 而 命名 套 接 字 则 被 保留 下 来 继续 处 理 来 自 其 他 客户 的 连接 。 如 果 服务 
器 编写 得 当 ， 它 就 可 以 充分 利用 多 个 连接 带 来 的 好 处 。Web 服 务 器 就 会 这 么 做 以 同时 服务 来 自 许多 客 
户 的 页 面 请 求 。 对 一 个 简单 的 服务 器 来 说 ， 后 续 的 客户 将 在 监听 队列 中 等 待 ， 直 到 服务 器 再 次 准备 就 
n. 

基于 套 接 字 系统 的 客户 端 更 加 简单 。 客 户 首先 调用 socket 创 建 一 个 未 命名 套 接 字 ， 然 后 将 服务 器 
的 命名 套 接 字 作为 一 个 地 址 来 调用 connect 与 服务 器 建立 连接 。 

-有 旦 连接 建立 ， 我 们 就 可 以 像 使 用 底层 的 文件 描述 符 那 样 用 套 接 字 来 实现 双向 的 数据 通信 。 


实验 一 个 简单 的 本 地 客户 


下 面 是 一 个 非常 简单 的 套 接 字 客 户 程序 的 例子 client1.c。 它 创建 一 个 未 命名 的 套 接 字 ， 然 后 把 
它 连接 到 服务 器 套 接 字 server_socket。 关 于 socket 系 统 调用 的 细节 ,我 们 将 在 讨论 完 与 地 址 相关 的 
- 些 问题 之 后 再 来 介绍 。 

(1) 包含 一 些 必要 的 头 文件 并 设置 变量 : 


#include <sys/types.h> 
#include <sys/socket.h> 
#include <stdio.h> 
#include <sys/un.h> 
#include <unistd.h> 
#include <stdlib.h> 








int main() 


int sockfd; 

int len; 

Struct sockaddr un address; 
int result; 

char ch = 'A'; 


Q) 为 客户 创建 一 个 套 接 字 : 
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Sockfd = socket(AF UNIX, SOCK STREAM, 0); 
(3) 根据 服务 器 的 情况 给 套 接 字 命名 : 


address.sun family = AF UNIX; 
strcpy(address.sun path, "server socket*); 
len = sizeof (address) ; 


(4) 将 我 们 的 套 接 字 连 接 到 服务 器 的 套 接 字 : 


result = connect(sockfd, (struct sockaddr *)&address, len]; 


if(result == -1) ( 
perror('oops: clienti*); 
exit(1); 

) 

(5) 现在 就 可 以 通过 sockfa 进 行 读 写 操作 了 : 
writeisockfd, &ch, 1); 
read(sockfd, &ch, 1); 
printf('char from server = tcWn*, ch); 
close (sockfd) ; 
exit(0); 

) 


运行 这 个 程序 时 ， 它 会 失败 ， 因 为 你 还 没有 创建 服务 器 端的 命名 套 接 字 (具体 的 错误 信息 将 随 系 
统 的 不 同 而 不 同 )。 

$ ./clientl 

oops: clientl: No such file or directory 

$ 


E AREMA 


下 面 是 一 个 非常 简单 的 服务 器 程序 serverl .c， 它 接受 来 自 客户 程序 的 连接 。 它 首先 创建 一 个 服 
务 器 套 接 字 ， 将 它 绑 定 到 一 个 名 字 ， 然 后 创建 一 个 监听 队列 ， 开 始 接受 客户 的 连接 ， 
(D 包含 必要 的 头 文件 并 设置 变量 : 


#include <sys/types.h> 
#include <sys/socket.h> 
#include <stdio.h> 
#include <sys/un.h> 
#include <unistd.h> 
#include <stdlib.h> 








int main() 


int server_sockfd, client_sockfd; 
int server_len, client_len; 

struct sockaddr un server_address; 
struct sockaddr un client address; 


(2) 删除 以 前 的 套 接 字 ， 为 服务 器 创建 一 个 未 命名 的 套 接 字 : 


unlink{"server_socket"); 
server sockfd = socket(AF UNIX, SOCK STREAM, 0); 
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(3) 命名 套 接 字 : 


Server_address. sun_family = AF_UNIX; 

strcpy (server_address. sun_path, “server_socket"); 

Server len = sizeof(server_address); 

bind(server sockfd, (struct sockaddr *)&server address, server len); 


(4) 创建 一 个 连接 队列 ， 开 始 等 待 客户 进行 连接 : 


listen(server sockfd, 5); 
while(1) ( 
char ch; 


printf('server waitingWn*); 
(5) 接受 一 个 连接 ; 
client len = sizeof(client address); 
client. sockfd = accept(server sockfd, 
(struct sockaddr *)&client address, &client len); 


(6) 对 cl ient_sockfa 套 接 字 上 的 客户 进行 读 写 操作 ; 


read(client sockfd, &ch, 1); 
cheer 
write(client sockfd, &ch, 1); 
Close (client. sockfd) ; 
H 
) 


这 个 例子 中 的 服务 器 程序 一 次 只 能 为 一 个 客户 服务 。 它 从 客户 那里 读 取 一 个 字符 ， 增 加 它 的 值 ， 
然后 再 把 它 写 回去 。 在 更 加 复杂 的 系统 中 ， 服 务 器 需要 为 每 个 客户 执行 更 多 的 处 理工 作 ， 这 种 一 次 只 
为 一 个 客户 服务 的 做 法 就 变 得 不 可 接受 了 ， 因 为 其 他 客户 只 有 等 到 服务 器 结束 上 一 个 客户 的 处 理 任务 
后 才能 处 理 它 的 连接 。 我 们 将 在 后 面 看 到 几 个 允许 同时 处 理 多 个 连接 的 解决 方案 。 

运行 服务 器 程序 时 ， 它 创建 一 个 套 接 字 并 开始 等 待 客户 的 连接 。 如 果 你 在 后 台 启 动 它 ， 让 它 独 立 
地 运行 ， 就 可 以 在 前 台 启 动 客户 程序 。 如 下 所 示 : 

$ ./serveri & 


[1] 1094 
$ server waiting 


服务 器 在 开始 等 待 客户 连接 时 会 打印 出 一 条 消息 。 在 上 面 的 例子 中 ， 服 务 器 等 待 的 是 一 个 文件 系 
统 套 接 字 ， 所 以 可 以 用 普通 的 1s 命 令 来 看 到 它 。 

记 住 : 用 完 一 个 套 接 字 后 ， 就 应 该 把 它 删除 掉 ， 即 使 是 在 程序 因 接收 到 一 个 信号 而 异常 终止 的 情 
况 下 也 应 该 这 么 做 。 这 可 以 避免 文件 系统 应 充斥 着 无 用 的 文件 而 变 得 混乱 。 


$ 1s -1P server socket 
Srwxr-xr-x 1 neil users 0 2007-06-23 11:41 server socket- 


访问 权限 前 面 的 字母 5 和 这 一 行 末尾 的 等 号 = 表示 该 设备 的 类 型 是 “ 套 接 字 ”。 套 接 字 的 创建 过 程 
与 普通 文件 一 样 ， 它 的 访问 权限 会 被 当前 的 掩 码 值 所 修改 。 如 果 使 用 ps 命令 ， 你 可 以 看 到 服务 器 正 运 
行 在 后 台 。 它 目前 处 于 休眠 状态 〈STAT 栏 显示 的 是 s)， 因 此 它 没有 消耗 CPU 资源 。 如 下 所 示 : 
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$ ps 1x 
F UID PID PPID PRI NI VSZ RSS WCHAN STAT TTY TIME COMMAND 
0 1000 23385 10689 17 0 1424 312 361800 S — pts/1 0:00 ./serverl 


现在 运行 客户 程序 ， 你 就 可 以 成 功 地 连接 到 服务 器 了 。 因 为 服务 器 套 接 字 已 经 存在 ， 所 以 你 可 以 
连接 到 它 并 与 服务 器 进行 通信 。 如 下 所 示 : 

$ ./clienti 

server waiting 

char from server - B 

$ 

服务 器 的 输出 和 客户 的 输出 在 我 们 的 终端 上 混在 了 一 起 , 但 还 是 可 以 看 出 服务 器 从 客户 那里 接收 
了 一 个 字符 ， 将 它 的 值 增加 ， 然 后 再 返回 它 。 接 着 服务 器 继续 运行 并 等 待 下 一 个 客户 的 到 来 。 如 果 同 
时 运行 多 个 客户 ， 它 们 将 被 依次 服务 ， 但 你 看 到 的 输出 结果 可 能 会 更 加 混乱 。 如 下 所 示 : 

$ ./clientl & ./clientl & ./clientl & 

[2] 23412 

[3] 23413 

[4] 23414 

server waiting 

char from server - B 

server waiting 

Char from serve: 

server waiting 

Char from server = 

server waiting 











[2] Done clienti 
[3]- Done clienti 
[4]* Done clienti 
$ 
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要 想 完全 理解 在 上 面 例子 中 所 使 用 的 系统 调用 ， 你 需要 先 学 习 一 些 UNIX 网 络 方面 的 知识 。 

套 接 字 的 特性 由 3 个 属性 确定 ， 它 们 是 : 域 (domain)、 类 型 (type) 和 协议 〈protocol)。 套 接 字 
还 用 地 址 作为 它 的 名 字 。 地 址 的 格式 随 域 〔 又 被 称 为 协议 族 ，protocol family) 的 不 同 而 不 同 。 每 个 协 
议 族 又 可 以 使 用 一 个 或 多 个 地 址 族 来 定义 地 址 格式 。 

1. 套 接 字 的 域 

域 指定 套 接 字 通 信 中 使 用 的 网 络 介质 。 最 常见 的 套 接 字 域 是 AF_INET， 它 指 的 是 Internet 网 络 ， 许 
多 Linux 局 域 网 使 用 的 都 是 该 网 络 ， 当 然 ， 因 特 网 自身 用 的 也 是 它 。 其 底层 的 协议 一 一 网 际 协议 〈IP) 
只 有 一 个 地 址 族 ， 它 使 用 一 种 特定 的 方式 来 指定 网 络 中 的 计算 机 ， 即 人 们 常 说 的 IP 地 址 。 

“下 一 代 ” 互 联网 协议 lpv6 被 设计 用 于 克服 标准 IP 带 来 的 一 些 问 题 ,特别 是 可 用 地 址 数量 

有 限 的 问题 . IPv6 使 用 一 个 不 同 的 套 接 字 域 AF_INET6 和 一 个 不 同 的 地 址 格式 . 人 们 期 望 它 能 

最 终 蔡 换 IP， 但 这 一 过 程 将 需要 经 过 许多 年 。 虽然 Linux 也 支持 Ipv6 实 现 ， 但 这 超出 了 本 书 介 

绍 的 范围 。 

虽然 我 们 几乎 总 是 用 域名 来 指定 因特网 上 的 联网 机 器 ， 但 它们 都 会 被 转换 为 底层 的 下 地 址 。 例 如 
192.168.1.99 就 是 一 个 趾 地 址 。 所 有 的 吓 地 址 都 用 4 个 数字 来 表示 ， 每 个 数字 都 小 于 256， 即 所 谓 的 点 分 四 元 
组 表示 法 (dotted quad)。 当 客户 使 用 套 接 字 进行 跨 网 络 的 连接 时 ， 它 就 需要 用 到 服务 器 计算 机 的 下 地 址 。 


518 第 15 章 套 接 F 





服务 器 计算 机 上 可 能 同时 有 多 个 服务 正在 运行 。 客 户 可 以 通过 IP 端 口 来 指定 一 台 联 网 机 器 上 的 某 
个 特定 服务 。 在 系统 内 部 ， 端 口 通过 分 配 一 个 唯一 的 16 位 的 整数 来 标识 ， 在 系统 外 部 ， 则 需要 通过 IP 
地 址 和 端口 号 的 组 合 来 确定 。 套 接 字 作为 通信 的 终点 ， 它 必须 在 开始 通信 之 前 绑 定 一 个 端口 。 

服务 器 在 特定 的 端口 等 待 客户 的 连接 。 知 名 服务 所 分 配 的 端口 号 在 所 有 Linux 和 UNIX 机 器 上 都 是 

- 样 的 。 它 们 通常 《但 并 不 总 是 如 此 ) 小 于 1024， 比 如 打印 机 缓冲 队列 进程 《515)、 rlogin (513). 
ftp (21) 和 httpa (80) 等 。 其 中 最 后 一 个 就 是 Web 服 务 器 的 标准 端口 。 一 般 情况 下 ， 小 于 1024 的 端 
口号 都 是 为 系统 服务 保留 的 ， 并 且 所 服务 的 进程 必须 具有 超级 用 户 权限 。X/Open 规 范 在 头 文件 
netdb.h 中 定义 了 一 个 常量 IPPORT_RESERVED， 它 代表 保留 端口 号 的 最 大 值 。 

因为 标准 服务 都 对 应 标准 的 端口 号 ， 所 以 计算 机 之 间 可 以 轻松 地 互 连 ， 而 不 需要 首先 协商 一 个 正 
确 的 端口 号 。 本 地 服务 可 以 使 用 非 标准 的 端口 地 址 。 

第 一 个 例子 中 的 域 是 UNIX 文 件 系统 域 AF_UNTX, 即使 是 一 台 还 未 联网 的 计算 机 上 的 套 接 字 也 可 以 
使 用 这 个 域 。 这 个 域 的 底层 协议 就 是 文件 输入 /输出 ， 而 它 的 地 址 就 是 文件 名 。 我 们 的 服务 器 套 接 字 的 
地 址 是 server_socker， 当 我 们 运行 服务 器 程序 时 ， 就 可 以 在 当前 目录 下 看 到 这 个 地 址 。 

其 他 可 以 使 用 的 域 还 包括 : 基于 ISO 标准 协议 的 网 络 所 使 用 的 AaF_Iso 域 和 用 于 施乐 (Xerox) 网 络 
系统 的 AF_xNs 域 。 它 们 都 不 在 本 章 的 讨论 范围 之 内 。 

2. 套 接 字 类 型 

-个 套 接 字 域 可 能 有 多 种 不 同 的 通信 方式 ， 而 每 种 通信 方式 又 有 其 不 同 的 特性 。 但 AF_UNTX 域 的 
套 接 字 没 有 这 样 的 问题 ， 它 们 提供 了 一 个 可 靠 的 双向 通信 路 径 。 在 网 络 域 中 ， 我 们 就 需要 注意 底层 网 
络 的 特性 ， 以 及 不 同 的 通信 机 制 是 如 何 受 到 它们 的 影响 的 。 

因特网 协议 提供 了 两 种 通信 机 制 : 流 Cstream) 和 数据 报 〈datagram)。 它 们 有 着 截然 不 同 的 服务 
层次 。 
eddie 
流 套 接 字 (在 某 些 方面 类 似 于 标准 的 输入 /输出 流 ) 提供 的 是 一 个 有 序 、 可 靠 、 双 向 字 节 流 的 连接 。 
因此 ， 发 送 的 数据 可 以 确保 不 会 丢失 、 复 制 或 乱 序 到 达 ， 并 且 在 这 一 过 程 中 发 生 的 错误 也 不 会 显示 出 
来 。 大 的 消息 将 被 分 片 、 传 输 、 再 重组 。 这 很 像 一 个 文件 流 ， 它 接收 大 量 的 数据 ， 然 后 以 小 数据 块 的 
形式 将 它们 写 入 底层 磁盘 。 流 套 接 字 的 行为 是 可 预见 的 。 

流 套 接 字 由 类 型 sock_sTREAM 指 定 ， 它 们 是 在 AF_INET 域 中 通过 TCP/IP 连 接 实 现 的 。 它 们 也 是 
AF_UNIX 域 中 常用 的 套 接 字 类 型 。 在 本 章 中 ， 我 们 将 重点 学 习 socK_sTREAM 套 接 字 ， 因 为 它们 在 编写 
网 络 程序 时 是 最 常用 的 。 

TCP/IP 代 表 的 是 传输 控制 协议 ( Transmission Control Protocol ) /网 际 协议 ( Internet 

Protocol )。IP 协 议 是 针对 数据 包 的 底层 协议 ， 它 提供 从 一 台 计 算 机 通过 网 络 到 达 另 一 台 计 算 

机 的 路 由 。 TCP 协议 提供 排序 、 流 控 和 重 传 ， 以 确保 大 数据 的 传输 可 以 完整 地 到 达 目 的 地 或 

报告 一 个 适当 的 错误 条 件 。 

e 数据 报 套 接 字 

与 流 套 接 字 相反 ， 由 类 型 Sock_DGRAM 指 定 的 数据 报 套 接 字 不 建立 和 维持 一 个 连接 。 它 对 可 以 发 
送 的 数据 报 的 长 度 有 限制 . 数据 报 作为 一 个 单独 的 网 络 消息 被 传输 , 它 可 能 会 丢失 、 复 制 或 乱 序 到 达 。 

数据 报 套 接 字 是 在 AF_INET 域 中 通过 UDP/IP 连 接 实现 的 ， 它 提供 的 是 一 种 无 序 的 不 可 靠 服 务 
《UDP 代表 的 是 用 户 数据 报 协议 )。 但 从 资源 的 角度 来 看 ， 相 对 来 说 它们 开销 比较 小 ， 因 为 不 需要 维持 
网 络 连接 。 而 且 因 为 无 需 花 费时 间 来 建立 连接 ， 所 以 它们 的 速度 也 很 快 。 
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数据 报 适用 于 信息 服务 中 的 “ 单 次 ”(single-shot) 查询 ， 它 主要 用 来 提供 日 常 状态 信息 或 执行 低 
优先 级 的 日 志 记 录 。 它 的 优点 是 服务 器 的 崩溃 不 会 给 客户 造成 不 便 ， 也 不 会 要 求 客户 重启 ， 因 为 基于 
数据 报 的 服务 器 通常 不 保留 连接 信息 ， 所 以 它们 可 以 在 不 打扰 其 客户 的 前 提 下 停止 并 重启 。 

现在 ， 我 们 暂时 离开 对 数据 报 的 讨论 ， 关 于 数据 报 的 更 多 信息 请 阅读 本 章 最 后 一 节 。 

3. 套 接 字 协 议 

只 要 底层 的 传输 机 制 允许 不 止 一 个 协议 来 提供 要 求 的 套 接 字 类 型 ， 我 们 就 可 以 为 套 接 字 选 择 一 个 
特定 的 协议 。 在 本 章 中 ， 我 们 将 重点 讨论 UNIX 网 络 套 接 字 和 文件 系统 套 接 字 ， 它们 不 需要 你 选择 一 
个 特定 的 协议 ， 只 需要 使 用 其 默认 值 即 可 。 


152.2 ”创建 套 接 字 
socket 系 统 调用 创建 一 个 套 接 字 并 返回 一 个 描述 符 ， 该 描述 符 可 以 用 来 访问 该 套 接 字 。 


#include <sys/types.h> 
#include «sys/socket.h» 





int socket (int domain, int type, int protocol); 

创建 的 套 接 字 是 一 条 通信 线路 的 一 个 端点 。aomain 参 数 指定 协议 族 ， type 参 数 指定 这 个 套 接 字 
的 通信 类 型 ，protocol 参 数 指定 使 用 的 协议 。 

domain 参 数 可 以 指定 的 协议 族 如 表 15-1 所 示 。 





"EL 
域 io 
AF_UNIX UNIX 域 协议 文件 系统 套 接 字 ) 
AF_INET ARPA 因 特 网 协议 《UNIX 网 络 套 接 字 ) 
AF 1S0 1SO 标 准 协议 
AF.NS 施乐 (Xerox) 网 络 系统 协议 
AF_IPX Novell IPX 协 议 


AF_APPLETALK Appletalk DDS 


ARE 一 一 

最 常用 的 套 接 字 域 是 AF_UNIX 和 AF_INET， 前 者 用 于 通过 UNIX 和 Linux 文 件 系统 实现 的 本 地 套 接 
字 , 后 者 用 于 UNIX 网 络 套 接 字 。 AF_INET 套 接 字 可 以 用 于 通过 包括 因特网 在 内 的 TCP/IP 网 络 进行 通信 
的 程序 。 微 软 Windows 系 统 的 Winsock 接 口 也 提供 了 对 这 个 套 接 字 域 的 访问 功能 。 

socket 函 数 的 参数 type 指 定 用 于 新 套 接 字 的 通信 特性 。 它 的 取 值 包 括 SOCK_STREAM 和 
SOCK_DGRAM。 

sock_sTREAM 是 一 个 有 序 、 可 靠 、 面 向 连接 的 双向 字 节 流 。 对 AF_INET 域 套 接 字 来 说 ， 它 默认 是 
通过 一 个 TCP 连 接 来 提供 这 一 特性 的 ，TCP 连 接 在 两 个 流 套 接 字 端 点 之 间 建 立 。 数据 可 以 通过 套 接 字 
连接 进行 双向 传递 。 TCP 协议 所 提供 的 机 制 可 以 用 于 分 片 和 重组 长 消息 并 且 可 以 重 传 可 能 在 网 络 中 
丢失 的 数据 。 

socK_DGRAM 是 数据 报 服务 。 我 们 可 以 用 它 来 发 送 最 大 长 度 固定 (通常 比较 小 ) 的 消息 ， 但 消息 
是 否 会 被 正确 传递 或 消息 是 否 不 会 乱 序 到 达 并 没有 保证 。 对 于 AF_INET 域 套 接 字 来 说 ， 这 种 类 型 的 通 
信 是 由 UDP 数据 报 来 提供 的 。 

通信 所 用 的 协议 一 般 由 套 接 字 类 型 和 套 接 字 域 来 决定 ， 通 常 不 需要 选择 。 只 有 当 和 需要 选择 时 ， 
我 们 才 会 用 到 protocol 参 数 。 将 该 参数 设置 为 0 表示 使 用 默认 协议 ， 我 们 将 在 本 章 的 所 有 例子 中 都 
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这 样 做 。 

socket 系统 调用 返回 一 个 描述 符 , 它 在 许多 方面 都 类 似 于 底层 的 文件 描述 符 。 当 这 个 套 接 字 连 接 
到 另 一 端的 套 接 字 后 ， 我 们 就 可 以 用 read 和 write 系 统 调用 ， 通过 这 个 描述 符 来 在 套 接 字 上 发 送 和 接 
收 数据 了 。close 系 统 调用 用 于 结束 套 接 字 连 接 。 


15.2.3 ” 套 接 字 地 址 


每 个 套 接 字 域 都 有 其 自己 的 地 址 格式 。 对 于 AF_UNIx 域 套 接 字 来 说 ， 它 的 地 址 由 结构 sockaaar_ 
un 来 描述 ， 该 结构 定义 在 头 文件 sys/un.h 中 。 

struct sockaddr un { 

sa family t sun family; /* AF UNIX */ 
char sun path[]; /* pathname */ 

N 

因此 ， 对 套 接 字 进 行 处 理 的 系统 调用 可 能 需要 接受 不 同类 型 的 地 址 ， 每 种 地 址 格式 都 使 用 一 种 类 
似 的 结构 来 描述 ， 它 们 都 以 一 个 指定 地 址 类 型 〈 套 接 字 域 ) 的 成 员 (在 本 例 中 是 sun_family) 开始 。 
在 AF_UNTX 域 中 ， 套 接 字 地 址 由 结构 中 的 sun_path 成 员 中 的 文件 名 所 指定 。 

在 当前 的 Linux 系 统 中 ， 由 X/Open 规范 定义 的 类 型 sa_fami 1y_t 在 头 文件 sys/un.h 中 声明 ， 它 是 
短 整数 类 型 。 此 外 ，sun_path 指 定 的 路 径 名 长 度 也 是 有 限制 的 (Linux 规 定 的 是 108 个 字符 ， 其 他 系统 
可 能 使 用 的 是 更 清楚 的 常量 ， 如 UNIx_MAx_paT#)。 因 为 地 址 结构 的 长 度 不 一 致 ， 所 以 许多 套 接 字 调 
用 需要 用 到 一 个 用 来 复制 特定 地 址 结构 的 长 度 变量 或 将 它 作 为 一 个 输出 。 

在 AF_INET 域 中 , 套 接 字 地 址 由 结构 sockaddr_in 来 指定 ， 该 结构 定义 在 头 文件 netinetyin.h 中 ， 
它 至 少 包含 以 下 几 个 成 员 : 


struct sockaddr in ( 


Short int sin family; /* AF INET */ 
unsigned short int ^ sin port; /* Port number */ 
struct in addr sin adár; /* Internet address */ 


v 
JP 地 址 结构 in_aqar 被 定义 为 


struct in addr { 
unsigned long int s adár; 
ui 


JP 地 址 中 的 4 个 字 节 组 成 一 个 32 位 的 值 。 一 个 AF_INET 套 接 字 由 它 的 域 、 下 地 址 和 端口 号 来 完全 确 
定 。 从 应 用 程序 的 角度 来 看 ， 所 有 套 接 字 的 行为 就 像 文 件 描述 符 一 样 ， 并 且 通 过 一 个 唯一 的 整数 值 来 
区 分 。 
1524 ”命名 套 接 字 

要 想 让 通过 socket 调 用 创建 的 套 接 字 可 以 被 其 他 进程 使 用 ， 服务 器 程序 就 必须 给 该 套 接 字 命名 。 
这 样 , AF_UNIx 套 接 字 就 会 关联 到 一 个 文件 系统 的 路 径 名 ， 正如 你 在 server1 例 子 中 所 看 到 的 ,AF_INET 
套 接 字 就 会 关联 到 一 个 IP 端 口号 。 

#include «sys/socket.h» 

int bind(int socket, const struct sockaddr *adáress, size t address len); 


bind 系 统 调用 把 参数 aadress 中 的 地 址 分 配给 与 文件 描述 符 socket 关 联 的 未 命名 套 接 字 。 地 址 结 
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构 的 长 度 由 参数 adaress_len 传 递 。 

地 址 的 长 度 和 格式 取决 于 地 址 族 。 bina 调 用 需要 将 一 个 特定 的 地 址 结构 指针 转换 为 指向 通用 地 
址 类 型 (struct sockaddr €). 

pinad 调 用 在 成 功 时 返回 0， 失败 时 返回 -1 并 设置 errno 为 表 15-2 中 的 -个 值 。 








sm EM EE 
ernoft 说 om 
E i 文件 描述 符 无 站 
horsock 文件 描述 符 对 应 的 不 是 一 个 套 接 字 
ETWAL KARENE E AE ANERE 
EADDRNOTAVAIL 地 址 不 可 用 
FADDRINUSE mokcesE T EET 
AE_UNTX 域 套 接 字 还 有 其 他 一 些 错误 代码 ， 如 表 15-3 所 示 。 
表 15-3 
errnoft * om 
EACCESS WOSBURER AE. AIEBI CHEAP IURE 
表明 选择 的 文件 名 不 符合 要 求 


ENOTDIR. ENAMETOOLONG 


15.2.5 ”创建 套 接 字 队 列 
为 了 能 够 在 套 接 字 上 接受 进入 的 连接 ， 服务 器 程序 必须 创建 一 个 队列 来 保存 未 处 理 的 请 求 。 它 用 
listen 系 统 调用 来 完成 这 一 工作 。 


#include «sys/socket.h» 





int listen(int socket, int backlog); 

Linux 系 统 可 能 会 对 队列 中 可 以 容纳 的 未 处 理 连 接 的 最 大 数目 做 出 限制 。 为 了 遵守 这 个 最 大 值 限 
制 ， li sten 函 数 将 队列 长 度 设置 为 backlog 参 数 的 值 。 在 套 接 字 队列 中 ， 等 待 处 理 的 进入 连接 的 个 数 
最 多 不 能 超过 这 个 数字 。 再 往 后 的 连接 将 被 拒绝 ， 导致 客 户 的 连接 请 求 失败 。1isten 函 数 提供 的 这 种 
机 制 允许 当 服务 器 程序 正 忙于 处 理 前 一 个 客户 请 求 的 时 候 ， 将 后 续 的 客户 连接 放 入 队列 等 待 处 理 。 
backlog 参 数 常 用 的 值 是 5。 

listen 函 数 在 成 功 时 返回 9， 失 败 时 返回 -1。 错误 代码 包括 EBADF、EINVAL 和 ENOTSOCK， 其 含义 
与 上 面 bind 系 统 调用 中 说 明 的 一 样 。 
1526 ”接受 连接 

一 旦 服务 器 程序 创建 并 命名 了 套 接 字 之 后 , 它 就 可 以 通过 accept 系统 调用 来 等 待 客户 建立 对 该 套 
接 字 的 连接 。 

#include «sys/socket.h» 

int accept(int socket， struct sockaddr *address, size_t *address len); 

accept RARI A A P UTI HERI socer B RE RO ERE LA E. 这 里 的 
客户 是 指 , 在 套 接 字 队 列 中 排 在 第 一 个 的 未 处 理 连接 。 accept 函 数 将 创建 一 个 新 套 接 字 来 与 该 客户 进 
行 通 信 ， 并 且 返回 新 套 接 字 的 描述 符 - 新 套 接 字 的 类 型 和 服务 器 监听 套 接 字 类 型 是 一 样 的 * 
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套 接 字 必须 事先 由 bind 调 用 命名 ， 并 且 由 liscen 调 用 给 它 分 配 一 个 连接 队列 。 连 接客 户 的 地 址 
将 被 放 入 address 参 数 指向 的 sockaGdr 结 构 中 。 如 果 我 们 不 关心 客户 的 地 址 ， 也 可 以 将 address 参 数 
指定 为 空 指针 。 

参数 address_len 指 定 客户 结构 的 长 度 。 如 果 客户 地 址 的 长 度 超过 这 个 值 ， 它 将 被 截断 。 所 以 在 
调用 accept 之 前 ，address_len 必 须 被 设置 为 预期 的 地 址 长 度 。 当 这 个 调用 返回 时 ，aGdress_len 将 
被 设置 为 连接 客户 地 址 结构 的 实际 长 度 。 

如 果 套 接 字 队 列 中 没有 未 处 理 的 连接 ，accept 将 阻塞 (程序 将 暂停 ) 直到 有 客户 建立 连接 为 止 。 
我 们 可 以 通过 对 套 接 字 文件 描述 符 设置 0_NONBLOCK 标 志 来 改变 这 一 行为 ， 使 用 的 函数 是 fcnc1， 如 下 
所 示 : i 

int flags = fcntl(socket, F GETFL, 0); 

fcntl(socket, F SETFL, O NONBLOCK|flags); 

当 有 未 处 理 的 客户 连接 时 ，accept 函 数 将 返回 一 个 新 的 套 接 字 文件 描述 符 。 发 生 错 误 时 ,accept 
函数 将 返回 -1。 可 能 的 错误 情况 大 部 分 与 binG、1isten 调 用 类 似 ， 其 他 的 错误 有 EwoULDBLOCK 和 
EINTR。 前 者 是 当 指 定 了 0_NONBLOCK 标 志 ， 但 队列 中 没有 未 处 理 连接 时 产生 的 错误 。 后 者 是 当 进 程 阻 
塞 在 accept 调 用 时 ， 执 行 被 中 断 而 产生 的 错误 。 


1527 ”请 求 连接 


客户 程序 通过 在 一 个 未 命名 套 接 字 和 服务 器 监听 套 接 字 之 间 建 立 连接 的 方法 来 连接 到 服务 器 。 它 
们 通过 connect 调 用 来 完成 这 一 工 


#include «sys/socket.h» 





int connect(int socket, const struct sockaddr *address, size t address len); 


参数 socket 指 定 的 套 接 字 将 连接 到 参数 adaress 指 定 的 服务 器 套 接 字 ，address 指 向 的 结构 的 长 
度 由 参数 adaress_len 指 定 。 参 数 socker 指 定 的 套 接 字 必 须 是 通过 socket 调 用 获得 的 一 个 有 效 的 





文件 描述 符 。 
成 功 时 ，connect 调 用 返回 0， 失 败 时 返回 -1。 可 能 的 错误 代码 见 表 15-4。 
表 15-4 
errno 值 wm 
EBADF 传递 给 socket 参 数 的 文件 描述 符 无 效 
EALREADY 该 套 接 字 上 已 经 有 一 个 正在 进行 中 的 连接 
ETIMEDOUT 连接 超时 
BCONNREFUSED 连接 请 求 被 服务 器 拒绝 


如 果 连 接 不 能 立刻 建立 ，connect 调 用 将 阻塞 一 段 不 确定 的 超时 时 间 。 一 旦 这 个 超时 时 间 到 达 ， 
连接 将 被 放弃 ，connect 调 用 失败 。 但 如 果 connect 调 用 被 一 个 信号 中 断 ， 而 该 信号 又 得 到 了 处 理 ， 
connect 调 用 还 是 会 失败 errno 被 设置 为 EINTR)， 但 连接 尝试 并 不 会 被 放弃 ， 而 是 以 异步 方式 继续 
建立 ， 程 序 必须 在 此 后 进行 检查 以 查看 连接 是 否 成 功 建立 。 

与 accept 调 用 一 样 ,connect 调 用 的 阻塞 特性 可 以 通过 设置 该 文件 描述 符 的 0_NONBLOCK 标 志 来 改 
变 。 此 时 ， 如 果 连 接 不 能 立刻 建立 ，connect 将 失败 并 把 errno 设 置 为 EINPROGRESS， 而 连接 将 以 异步 
方式 继续 进行 。 
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虽然 异步 连接 难于 处 理 , 但 我 们 可 以 在 套 接 字 文件 描述 符 上 ,用 select 调 用 来 检查 套 接 字 是 否 已 
处 于 写 就 绪 状 态 。 我 们 将 在 本 章 的 后 面 介绍 select 调 用 。 


15.28 ”关闭 套 接 字 


你 可 以 通过 调用 close 函 数 来 终止 服务 器 和 客户 上 的 套 接 字 连接 ， 就 如 同 对 底层 文件 描述 符 进行 
关闭 一 样 。 你 应 该 总 是 在 连接 的 两 端 都 关闭 套 接 字 。 对 于 服务 器 来 说 ， 应 该 在 read 调 用 返回 0 时 关闭 
套 接 字 ， 但 如 果 套 接 字 是 一 个 面向 连接 类 型 的 ， 并 且 设置 了 socK_LINGER 选 项 ，close 调 用 会 在 该 套 
接 字 还 有 未 传输 数据 时 阻塞 。 你 将 在 本 章 后 面 的 内 容 中 学 习 到 如 何 设置 套 接 字 选 项 。 


15.29 $i 


在 介绍 完 与 套 接 字 相关 的 基本 系统 调用 后 ， 我 们 来 看 几 个 示例 程序 。 我 们 将 尽量 使 用 网 络 套 接 字 
而 不 是 文件 系统 套 接 字 。 文 件 系统 套 接 字 的 缺点 是 ， 除 非 程序 员 使 用 一 个 绝对 路 径 名 ， 否 则 套 接 字 将 
创建 在 服务 器 程序 的 当前 目录 下 。 为 了 让 它 更 具 通用 型 ， 你 需要 将 它 创建 在 一 个 服务 器 及 其 客户 都 认 
可 的 可 全 局 访问 的 目录 〈 如 /cmp 目 录 ) 中 。 而 对 网 络 套 接 字 来 说 ， 你 只 需要 选择 一 个 未 被 使 用 的 端口 
号 即 可 。 

我 们 的 例子 将 选择 端口 号 9734， 这 个 端口 号 是 在 避 开 标准 服务 的 前 提 下 随意 选择 的 (我 们 不 能 使 
用 小 于 1024 的 端口 号 ， 因 为 它们 都 是 为 系统 使 用 保留 的 ) 。 其 他 端口 号 及 通过 它们 提供 的 服务 通常 都 
列 在 系统 文件 /etc/services 中 。 编 写 基于 套 接 字 的 应 用 程序 时 ， 请 注意 总 要 选择 没有 列 在 该 配置 文 
件 中 的 端口 号 。 


请 注意 在 程序 client2.c 和 server2.c 中 有 个 我 们 故意 设置 的 错误 ， 我 们 将 在 
client3.c 和 server3.c 中 修复 这 个 错误 . 所 以 请 不 要 将 client2.c 和 server2.c 中 的 代码 
用 到 你 自己 的 程序 中 . 


我 们 将 在 局 域 网 中 运行 我 们 的 客户 和 服务 器 ， 但 网 络 套 接 字 不 仅 可 用 于 局 域 网 ， 任 何 带 有 因特网 
连接 〈 即 使 是 一 个 调制 解 调 器 拨号 连接 ) 的 机 器 都 可 以 使 用 网 络 套 接 字 来 彼此 通信 。 甚 至 可 以 在 一 台 
UNIX 单 机 上 运行 基于 网 络 的 程序 ， 因 为 UNIX 计 算 机 通常 会 配置 了 一 个 只 包含 它 自身 的 回路 
(loopback) 网 络 。 出 于 演示 的 目的 ， 我 们 将 使 用 这 个 回路 网 络 。 回 路 网 络 对 调试 网 络 应 用 程序 也 很 有 
用 ， 因 为 它 排除 了 任何 外 部 网 络 问题 。 

回路 网 络 中 只 包含 一 台 计算 机 ， 传 统 上 它 被 称 为 localhost， 它 有 一 个 标准 的 耳 地 址 127.0.0.1。 这 就 
是 本 地 主机 。 你 可 以 在 网 络 主机 文件 /etc/hosts 中 找到 它 的 地 址 ， 在 该 文件 中 还 列 出 了 在 共享 网 络 
中 的 其 他 主机 的 名 字 和 对 应 的 地 址 。 

每 个 与 计算 机 进行 通信 的 网 络 都 有 一 个 与 之 关联 的 硬件 接口 。 一 台 计 算 机 可 能 在 每 个 网 络 中 都 有 
一 个 不 同 的 网 络 名 ， 当 然 也 就 会 有 几 个 不 同 的 IP 地 址 。 例 如 ，Neil 的 机 器 tilde 就 有 3 个 网 络 接口 ， 因 
此 也 就 有 3 个 IP 地 址 。 它 们 被 记录 在 文件 /etc/hosts 中 ， 如 下 所 示 : 

















127.0.0.1 localhost # Loopback 
192.168.1.1 tilde.localnet # Local, private Ethernet 
158.152.X.X  tilde.demon.co.uk # Modem dial-up 


第 一 个 就 是 简单 的 回路 网 络 ， 第 二 个 是 通过 一 块 以 太 网 卡 来 访问 的 局 域 网 ， 第 三 个 是 到 一 个 因 特 
网 接 入 服务 提供 商 的 调制 解 调 器 连接 。 你 编写 的 基于 套 接 字 的 网 络 程序 ， 可 以 不 做 任何 修改 就 能 通过 
任何 一 个 网 络 接口 与 服务 器 进行 通信 。 
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EUN 网 络 客户 


下 面 是 一 个 修改 过 的 客户 程序 client2.c， 它 通过 回路 网 络 连接 到 一 个 网 络 套 接 字 。 这 个 程序 有 
一 个 与 硬件 相关 的 细微 错误 ， 我 们 将 在 本 章 的 后 面 再 讨论 它 。 

(D 包含 必要 的 头 文件 并 设置 变量 : 

#include <sys/types.h> 

#include <sys/socket.h> 

#include <stdio.h> 

#include «netinet/in.h» 

#include <arpa/inet.h> 

#include <unistd.h> 

#include <stdlib.h> 





int main() 


int sockfd; 

int len; 

struct sockaddr_in address; 
int result; 

char ch = 'A'; 


Q) 为 客户 创建 一 个 套 接 字 : 
sockfd = socket(AF INET, SOCK STREAM, 0); 
(3) 命名 套 接 字 ， 与 服务 器 保持 一 致 : 
address.sin family = AF INET; 
address.sin addr.s addr = inet addr(*127.0.0.1*); 


address.sin port = 9734; 
len = sizeof (address); 


这 个 程序 的 剩余 部 分 与 本 章 前 面 的 client1.c 完 全 一 样 。 运行 这 个 版 本 的 客户 程序 时 ， 它 将 连接 
失败 ， 因 为 还 没有 服务 器 运行 在 这 人 台 计 算 机 的 9734 端 口上 。 


$ ./client2 
oops: client2: Connection refused 


客户 程序 用 在 头 文件 net inet /in.h 中 定义 的 sockaaar_in 结 构 指 定 了 一 个 AF_INET 地 址 。 它 
试图 连接 到 IP 地 址 为 127.0.0.1 的 主机 上 的 服务 器 。 它 用 inet_aGar 函 数 将 IP 地 址 的 文本 表示 方式 转换 
为 符合 套 接 字 地 址 要 求 的 格式 。 inet 的 手册 页 中 有 对 其 他 地 址 转换 函数 的 详细 说 明 。 


BE ems ———— 


你 还 需要 修改 服务 器 程序 ， 让 它 在 选 好 的 端口 号 上 等 待 客户 的 连接 。 下 面 是 修改 过 的 服务 器 程序 
server2.c。 

(1) 包含 必要 的 头 文件 并 设置 变量 : 

#include <sys/types.h> 

#include «sys/socket.h» 

#include <stdio.h> 
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finclude «netinet/in.h» 
*include «arpa/inet.h» 
#include <unistd.h> 
#include <stdlib.h> 


int main() 

t 
int server sockfd, client sockfd; 
int server len, client len; 
struct sockaddr in server address; 
struct sockadádr in client. address; 


Q) 为 服务 器 创建 一 个 未 命名 套 接 字 : 
server sockfd = socket(AF INET, SOCK STREAM, 0); 









(3) 命名 套 接 字 : 
server addr m family = AF INET; 
server addr m addr.s addr = inet addr(*127.0.0.1*); 
server address.sin port = 9734; 


server len = sizeof(server address); 
bind(server sockfd, (struct sockaddr *)&server address, server len); 


从 这 以 后 的 代码 与 serverl.c 完 全 一 样 。 运 行 clienc2 和 server2 将 显示 与 你 在 前 面 运行 
client1 和 serverl 一 样 的 结果 。 

服务 器 程序 创建 一 个 AF_INET 域 的 套 接 字 ， 并 安排 在 它 之 上 接受 连接 。 这 个 套 接 字 被 绑 定 到 你 选 
择 的 端口 。 指 定 的 地 址 决定 了 允许 建立 连接 的 计算 机 。 通 过 指定 像 客 户 程序 中 一 样 的 回路 地 址 ， 你 就 
把 通信 限制 在 本 地 主机 上 。 

如 果 想 允许 服务 器 和 远程 客户 进行 通信 ， 就 必须 指定 一 组 你 允许 连接 的 耻 地 址 。 你 可 以 用 特殊 值 
INADDR_ANY 来 表示 ， 你 将 接受 来 自 计算 机 任何 网 络 接口 的 连接 。 如 果 你 愿意 ， 还 可 以 通过 分 离 如 内 
部 局 域 网 和 外 部 广域网 连接 的 方式 来 区 分 不 同 的 网 络 接口 。INADDR_ANY 是 一 个 32 位 的 整数 值 ， 它 可 
以 用 在 地 址 结构 的 sin_adar.s_adar 域 中 。 但 首先 你 需要 解决 一 个 问题 ， 如 下 节 所 示 。 








15.210 ”主机 字 节 序 和 网 络 字 节 序 


当 在 基于 Intel 处 理 器 的 Linux 机 器 上 运行 新 版 本 的 服务 器 和 客户 程序 时 ， 我 们 可 以 用 netstat 命 令 
来 查看 网 络 连接 状况 。 这 个 命令 在 大 多 数 配置 了 网 络 功能 的 UNIX 系 统 上 都 能 找到 。 它 显示 了 客户 / 服 
务 器 连接 正在 等 待 关闭 。 连 接 将 在 一 小 段 超时 时 间 之 后 关闭 (具体 的 输出 内 容 将 随 Linux 版 本 的 不 同 
而 不 同 )。 

$ ./server2 & ./client2 

13] 23770 

server waiting 

server waiting 

char from server = B 

$ netstat -A inet 

Active Internet connections (w/o servers) 

Proto Recv-Q Send-Q Local Address ^ Foreign Address (State) User 

tep iR 0 localhost:1574 1localhost:1174 TIME WAIT root. 
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在 尝试 运行 本 书 中 其 他 示例 程序 之 前 ， 请 确保 已 终止 正在 运行 的 示例 服务 器 程序 ， 因 
为 它们 会 争夺 来 自 客户 的 连接 ， 会 导致 运行 结果 混乱 。 你 可 以 用 下 面 的 命令 来 将 它们 CO, 
括 本 章 后 面 将 介绍 的 示例 程序 ) 一 起 杀 摔 : 


kilall serverl server2 server3 server4 servers 


你 可 以 看 到 这 条 连接 对 应 的 服务 器 和 客户 的 端口 号 。1ocal address 一 栏 显 示 的 是 服务 器 ， 而 
foreign address 一 栏 显示 的 是 远程 客户 即使 是 在 同一 台 机 器 上 ， 它 仍然 是 通过 网 络 连接 的 )。 为 
了 确保 所 有 套 接 字 都 是 不 同 的 ， 这 些 客户 端口 一 般 都 与 服务 器 监听 套 接 字 不 同 ， 并 且 在 这 台 计 算 机 上 
是 唯一 的 。 

可 是 ， 显 示 的 本 地 地 址 (服务 器 套 接 字 ) 端口 是 1574 或 者 你 可 能 会 看 到 显示 的 是 一 个 服务 名 
mvel-lm)， 而 我 们 选择 的 端口 是 9734。 为 什么 会 不 一 样 呢 ? 答案 是 , 通过 套 接 字 接口 传递 的 端口 号 和 
地 址 都 是 二 进 制 数字 。 不 同 的 计算 机 使 用 不 同 的 字 节 序 来 表示 整数 。 例 如 ，Intel 处 理 器 将 32 位 的 整数 
分 为 4 个 连续 的 字 节 ， 并 以 字 节 序 1-2-3-4 存 储 到 内 存 中 ， 这 里 的 1 表示 最 高 位 的 字 节 。 而 IBM PowerPC 
处 理 器 是 以 字 节 序 4-3-2-1 的 方式 来 存储 整数 。 如 果 保存 整数 的 内 存 只 是 以 逐个 字 节 的 方式 来 复制 ， 两 
个 不 同 的 计算 机 得 到 的 整数 值 就 会 不 一 致 。 

为 了 使 不 同类 型 的 计算 机 可 以 就 通过 网 络 传输 的 多 字 节 整数 的 值 达成 一 致 ， 你 需要 定义 一 个 网 络 
字 节 序 。 客 户 和 服务 器 程序 必须 在 传输 之 前 ， 将 它们 的 内 部 整数 表示 方式 转换 为 网 络 字 节 序 。 它 们 通 
过 定义 在 头 文件 netinet /in.h 中 的 函数 来 完成 这 一 工作 。 这 些 函数 如 下 所 示 : 


#include «netinet/in.h» 

















unsigned long int htonl(unsigned long int hostlong); 
unsigned short int htons(unsigned short int hostshort); 
unsigned long int ntohl(unsigned long int netlong); 
wnsigned short int ntohs(unsigned short int netshort); 


这 些 函 数 将 16 位 和 32 位 整数 在 主机 字 节 序 和 标准 的 网 络 字 节 序 之 间 进行 转换 。 函 数 名 是 与 之 对 应 
的 转换 操作 的 简写 形式 。 例 如 “host to network, long”(hton1， 长 整数 从 主机 字 节 序 到 网 络 字 节 序 的 
转换 ) 和 “host to network, short”(htons， 短 整数 从 主机 字 节 序 到 网 络 字 节 序 的 转换 )。 如 果 计 算 机 
本 身 的 主机 字 节 序 与 网 络 字 节 序 相同 ， 这 些 函 数 的 内 容 实际 上 就 是 空 操作 。 
为 了 保证 16 位 的 端口 号 有 正确 的 字 节 序 ， 你 的 服务 器 和 客户 需要 用 这 些 函数 来 转换 端口 地 址 。 新 
服务 器 程序 server3 .c 中 的 改动 是 : 
server address.sin addr.s addr = htonl(INADDR ANY); 
Server address.sin port - htons(9734); 
你 不 需要 对 函数 调用 inet_addr (*127.0.0.1*) 进行 转换 ， 因 为 inet_addr 已 被 定义 为 产生 一 
个 网 络 字 节 序 的 结果 。 新 客户 程序 client3.c 中 的 改动 是 : 


address.sin port = htons(9734); 


服务 器 也 做 了 改动 ， 通 过 用 INADDR_ANY 来 允许 到 达 服务 器 任 一 网 络 接口 的 连接 。 
现在 ， 运 行 server3 和 client3 时 ， 你 将 看 到 本 地 连接 使 用 的 是 正确 的 端口 。 

$ netstat 

Active Internet connections 

Proto Recv-Q Send-Q Local Address Foreign Address (State) User 
tep 1 0 localhost:9734 localhost:1175 TIME_WAIT root 
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请 记 住 ,如果 你 使 用 的 计算 机 上 的 主机 字 节 序 和 网 络 字 节 序 相同 ， 你 将 不 会 看 到 任何 差 
Je. 但 为 了 让 不 同体 系 结构 的 计算 机 上 的 客户 和 服务 器 可 以 正确 地 操作 ， 总 是 在 网 络 程序 中 
使 用 这 些 转换 函数 仍然 是 非常 重要 的 。 


15.3 网络 信 息 


到 目前 为 止 ， 我 们 的 客户 和 服务 器 程序 一 直 是 把 地 址 和 端口 号 编译 到 它们 自己 的 内 部 。 对 于 一 个 
更 通用 的 服务 器 和 客户 程序 来 说 ， 我 们 可 以 通过 网 络 信息 函数 来 决定 应 该 使 用 的 地 址 和 端口 。 

如 果 你 有 足够 的 权限 ， 也 可 以 将 自己 的 服务 添加 到 /ecc/services 文 件 中 的 已 知 服务 列 
在 这 个 文件 中 为 端口 号 分 配 一 个 名 字 ， 使 用 户 可 以 使 用 符号 化 的 服务 名 而 不 是 端口 号 的 数字 。 

类 似 地 ， 如 果 给 定 一 个 计算 机 的 名 字 ， 你 可 以 通过 调用 解析 地 址 的 主机 数据 库 函 数 来 确定 它 的 IP 
地 址 。 这 些 函 数 通 过 查询 网 络 配置 文件 来 完成 这 一 工作 ， 如 /etc/hosts 文 件 或 网 络 信息 服务 。 常 用 
的 网 络 信息 服务 有 NIS (Network Information Service， 网 络 信息 服务 ， 以 前 称 为 Yellow Pages， 黄 页 服 
务 ) 和 DNS (Domain Name Service， 域 名 服务 )。 

主机 数据 库 函 数 在 接口 头 文件 netab.h 中 声明 ， 如 下 所 示 : 


#include «netdb.h» 





ep, 3f 


struct hostent *gethostbyaddr(const void *addr, size t len, int type); 
struct hostent *gethostbyname(const char *name); 
这 些 函 数 返 回 的 结构 中 至 少 会 包含 以 下 几 个 成 员 : 
struct hostent ( 
Char *h name; /* name of the host */ 
Char **h aliases; /* list of aliases (nicknames) */ 
int h adártype; 
int h length; f the address */ 
char **h addr list /* list of address (network order) */ 








n 

如 果 没 有 与 我 们 查询 的 主机 或 地 址 相关 的 数据 项 ， 这 些 信息 函数 将 返回 一 个 空 指针 。 

类 似 地 ， 与 服务 及 其 关联 端口 号 有 关 的 信息 也 可 以 通过 一 些 服务 信息 函数 来 获取 。 如 下 所 示 : 

#include «netdb.h» 

struct servent *getservbyname(const char *name, const char *proto); 

struct servent *g rvbyport(int port, const char *proto); 

proto 参 数 指定 用 于 连接 该 服务 的 协议 ， 它 的 两 个 取 值 是 ccp 和 udp， 前 者 用 于 sock_sTREAM 类 型 
的 TCP 连 接 ， 后 者 用 于 sock_pGRAM 类 型 的 UPD 数 据 报 。 

结构 servent 至 少 包含 以 下 儿 个 成 员 : 


struct servent { 





Char *s name; /* name of the service */ 

Char **s aliases;  /* list of aliases (alternative names) */ 

int s port; /* The IP port number */ 

Char *s proto; /* The service type, usually "tcp" or "udp" */ 


如 果 想 获得 某 台 计算 机 的 主机 数据 库 信 息 ， 可 以 调用 gethostbyname 函 数 并 且 将 结果 打印 出 来 。 
注意 ， 要 把 返回 的 地 址 列表 转换 为 正确 的 地 址 类 型 ， 并 用 函数 inet_ntoa 将 它们 从 网 络 字 节 序 转换 为 
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可 打印 的 字符 串 。 函 数 inet_ntoa 的 定义 如 下 所 示 : 
#include «arpa/inet.h» 


Char *inet ntoa(struct in addr in) 

这 个 函数 的 作用 是 ， 将 一 个 因特网 主机 地 址 转换 为 一 个 点 分 四 元 组 格式 的 字符 串 。 它 在 失败 时 返 
回 -1， 但 POSIX 规 范 并 未 定义 任何 错误 。 其 他 可 用 的 新 函数 还 有 gethostname， 它 的 定义 如 下 所 示 : 

#include «unistd.h» 


int gethostname(char *name, int namelength); 

这 个 函数 的 作用 是 ， 将 当前 主机 的 名 字 写 入 name 指 向 的 字符 串 中 。 主 机 名 将 以 nul1 结 尾 。 参 数 
namelength 指 定 了 字符 串 name 的 长 度 ， 如 果 返 回 的 主机 名 太 长 ， 它 就 会 被 截断 。gethostname 在 成 
功 时 返回 0， 失 败 时 返回 -1， 但 POSIX 规 范 中 没有 定义 任何 错误 。 


实验 网 络 信息 


下 面 这 个 程序 getname.c 用 来 获取 一 台 主 机 的 有 关 信息 。 
(1) 与 往常 一 样 ， 包 含 必要 的 头 文件 并 声明 变量 : 
#include <netinet/in.h> 
#include <arpa/inet.h> 
#include <unistd.h> 
#include «netdb.h» 

#include <stdio.h> 
#include <stdlib.h> 


int main(int argc, char *argv[]) 


char *host, **names, **addrs; 
struct hostent *hostinfo; 


(2) 把 host 变 量 设置 为 gecname 程 序 所 提供 的 命令 行 参数 ， 或 默认 设置 为 用 户主 机 的 主机 名 ， 


if(argc == 1) ( 
char myname[256]; 
gethostname(myname, 255); 
host = myname; 
) 
else 
host = argv[1]; 
(3) 调用 gethostbyname， 如 果 未 找到 相应 的 信息 就 报告 一 条 错误 : 
hostinfo = gethostbyname (host); 
if(!hostinfo) ( 
fprintf(stderr, "cannot get info for host: ¢s\n", host); 
exit(1); 
) 


(4) 显示 主机 名 和 它 可 能 有 的 所 有 别名 : 


printf('results for host %s:\n", host); 
printf("Name: $sWn*, hostinfo -> h name); 
printf('Aliases:*); 
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names = hostinfo -> h aliases; 
while(*names) ( 
printf(* $s", *names]; 
nameses; 
) 
printf(*n"); 


(5) 如 果 查 询 的 主机 不 是 一 个 人 P 主 机 ， 就 发 出 警告 并 退出 : 
if(hostinfo -> h addrtype != AF_INET) ( 
fprintf (stderr, "not an IP host!in*); 


exit(1); 
) 


(6) 否则 ， 显 示 它 的 所 有 IP 地 址 : 
addrs = hostinfo -> h addr list; 
while(*addrs) ( 
printf(* ès", inet ntoa(*(struct in_addr *)*adárs)); 
addrs++; 
) 
printf(*W*); 
exit(0); 
) 


此 外 ， 你 也 可 以 用 gethostbyadar 函 数 来 查 出 哪个 主机 拥有 给 定 的 IP 地 址 。 你 可 以 在 服务 器 上 用 
这 个 函数 来 查找 连接 客户 的 来 源 。 

实验 解析 

getname 程 序 通过 调用 gethostbyname 从 主机 数据 库 中 提取 出 主机 的 信息 。 亿 
的 别名 《这 台 计 算 机 的 其 他 名 字 ) 和 该 主机 在 它 的 网 络 接口 上 使 用 的 IP 地 址 。 
定 主机 名 tilde 时 ， 程 序 给 出 了 以 太 网 和 调制 解 调 器 两 个 网 络 接口 的 信息 。 如 下 所 

$ ./getname tilde 

results for host tilde: 

Name: tilde.localnet 


Aliases: tilde 
192.168.1.1 158.152.x.x 

当 我 们 使 用 主机 名 localhost 时 ， 程 序 只 给 出 了 回路 网 络 的 信息 。 如 下 所 示 : 
$ ./getname localhost 

results for host localhost: 

Name: localhost 

Aliases: 

127.0.0.1 


现在 可 以 改进 我 们 的 客户 程序 ， 使 它 可 以 连接 到 任何 有 名 字 的 主机 。 这 次 不 是 连接 到 我 们 的 示例 
服务 器 ， 而 是 连接 到 一 个 标准 服务 ， 这 样 就 可 以 演示 端口 号 的 提取 操作 了 。 

大 多 数 UNIX 和 一 些 Linux 系 统 都 有 一 项 标准 服务 daaytime， 它 提供 系统 的 日 期 和 时 间 。 客 户 可 以 
连接 到 这 个 服务 来 查看 服务 器 的 当前 日 期 和 时 间 。 下 面 就 是 完成 这 一 工作 的 客户 程序 getdate.c。 


** 连接 到 标准 服务 


(1) 包含 必要 的 头 文件 和 变量 声明 : 





印 出 主机 名 、 它 
这 个 示例 程序 并 指 
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#include «sys/socket.h» 
#include «netinet/in.h» 
#include «netdb.h» 
#include <stdio.h> 
#include <unistd.h> 
#include <stdlib.h> 


int main(int argc, char *argv[]) 
t 
char *host; 
int sockfd; 
int len, result; 
struct sockaddr in address; 
struct hostent *hostinfo; 
struct servent *servinfo; 
char buffer[128]; 


if(argc == 1) 

host = "localhost"; 
else 

host = argv[1]; 

(2) 查找 主机 的 地 址 ， 如 果 找 不 到 ， 就 报告 一 条 错误 : 
hostinfo = gethostbyname(host); 
if(thostinfo) ( 

fprintf(stderr, "no host: $sWn", host); 


exit(1); 
) 


(3) 检查 主机 上 是 否 有 aaytime 服 务 : 


servinfo = getservbyname( "daytime", "tcp*); 
if(!servinfo) ( 
fprintf (stderr, "no daytime service|n'); 
exit(1); Și 
) 
printf(*daytime port is $din*, ntohs(servinfo -> s port)); 


(4) 创建 一 个 套 接 : 
sockfd = socket (AF_INET, SOCK_STREAM, 0); 
(5) 构造 connect 调 用 要 使 用 的 地 址 : 


address. sin_family = AF INET; 

address.sin port = servinfo -> s port; 

address.sin addr = *(struct in addr *)*hostinfo -> h adádr list; 
len = sizeof (address) ; 


(6) 然后 建立 连接 并 取得 有 关 信息 : 


result = connect(sockfd, (struct sockaddr *)&address, len); 
if(result == -1) ( 

perror(*oops: getdate*); 

exit(1); 
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result = read(sockfd, buffer, sizeof(buffer]]; 
buffer[result] = '\0'; 
printf(*read &d bytes: $s*, result, buffer); 


close(sockfd); 
exit(0); 
} 
你 可 以 用 getaate 获 取 任 一 已 知 主机 的 日 期 和 时 间 。 
$ ./getdate localhost 
daytime port is 13 
read 26 bytes: 24 JUN 2007 06:03:03 BST 
$ 


如 果 你 看 到 如 下 所 示 的 一 条 错误 信息 : 

oops: getdate: Connection refused 

或 是 : 

oops: getdate: No such file or directory 

这 可 能 是 因为 你 正在 连接 的 计算 机 没有 启用 aaytime 服 务 。 最 新 版 本 的 Linux 系 统 在 默认 情况 下 都 
没有 启用 该 服务 。 在 下 一 节 中 ， 你 将 学 习 如 何 启 用 这 项 服务 以 及 其 他 一 些 服务 。 

运行 这 个 程序 时 ， 你 可 以 指定 要 连接 的 主机 。adaycime 服 务 的 端口 号 是 通过 网 络 数据 库 函数 
getservbyname 来 确定 的 ， 该 函数 以 与 返回 主机 信息 类 似 的 方法 返回 和 网 络 服务 相关 的 信息 。 程 序 
getdate 尝 试 连接 到 指定 主机 返回 的 地 址 列表 中 的 第 一 个 地 址 ， 如 果 成 功 ， 它 就 读 取 daycime 服 务 返 
-个 表示 UNIX 日 期 和 时 间 的 字符 串 。 


15.3.1 因特网 守护 进程 (xinetd/ineta) 


UNIX 系 统 通常 以 超级 服务 器 的 方式 来 提供 多 项 网 络 服务 。 超 级 服务 器 程序 〈 因 特 网 守护 进程 
xinetd 或 inetd) 同时 监听 许多 端口 地 址 上 的 连接 。 当 有 客户 连接 到 某 项 服务 时 ， 守 护 程序 就 运行 相 
应 的 服务 器 。 这 使 得 针对 各 项 网 络 服务 的 服务 器 不 需要 一 直 运 行 着 ， 它 们 可 以 在 需要 时 启动 。 

因特网 守护 进程 在 现代 Linux 系 统 中 是 通过 xinetd 来 实现 的 。xineta 实 现 方式 取代 了 原 

来 的 UNIX 程 序 ineca, 尽管 你 仍然 会 在 一 些 较 老 的 Linux 系 统 中 以 及 其 他 的 类 UNIX 系 统 中 看 

到 inetqd 的 应 用 。 

我 们 通常 是 通过 一 个 图 形 用 户 界面 来 配置 xineta 以 管理 网 络 服务 ， 但 我 们 也 可 以 直接 修改 它 的 
配置 文件 。 它 的 配置 文件 通常 是 /etc/xineta.conf 和 /etc/xinetd.a 目 录 中 的 文件 。 

每 一 个 由 xineta 提 供 的 服务 都 在 /etc/xineta.a 目 录 中 有 一 个 对 应 的 配置 文件 。xineta 将 在 其 
启动 时 或 被 要 求 的 情况 下 读 取 所 有 这 些 配置 文件 。 

下 面 是 一 些 xinetd 配 置 文件 的 例子 ， 首 先是 aaycime 服 务 的 配置 : 

#default: off 

# description: A daytime server. This is the tcp version. 

service daytime 


t 











Socket type = stream 
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protocol = tcp 
wait = no 
user - root 
type = INTERNAL 
ia = daytime-stream 
FLAGS = IPv6 IPv4 
) 
然后 是 文件 传输 服务 的 配置 : 


* default: off 
# description: 
+ The vsftpd FTP server serves FTP connections. It uses 
normal, unencrypted usernames and passwords for authentication. 
vsftpd is designed to be secure. 


+ 

+ 

+ 

# NOTE: This file contains the configuration for xinetd to start vsftpd. 
+ the configuration file for vsftp itself is in /etc/vsftpd.conf 
service ftp 
T 
+ 
4 
* 
+ 


server_args = 
log_on_success += DURATION USERID 
log.on failure += USERID 
nice = 10 

Socket type = stream 

protocol = tep 

wait = no 

user = root 

server = [usr/sbin/vsftpd 


) 


我 们 的 gerdate 程 序 连接 的 aaytime 服 务实 际 上 就 是 由 xineca 自 身 负责 处 理 的 〈 它 被 标记 为 
internal， 即 内 部 )， 它 同时 支持 SOcK_STREAM (tcp) 和 SocK_DGRAM (uap) 套 接 字 。 

ftp 文 件 传输 服务 只 支持 SOCK_STRERAM 套 接 字 ， 并 且 是 由 一 个 外 部 程序 来 提供 服务 的 。 在 本 例 中 
这 个 程序 是 vsftpa， 当 有 客户 连接 到 ftp 的 端口 时 ， 守 护 进程 就 会 启动 它 。 

为 了 激活 服务 配置 的 修改 ， 你 需要 编辑 xineta 的 配置 文件 ， 然 后 发 送 一 个 挂 起 信号 给 守护 进程 ， 
但 我 们 建议 你 使 用 一 种 更 加 友好 的 方式 来 配置 服务 。 为 了 允许 time-of-day 客 户 进行 连接 ， 你 可 以 使 用 
Linux 系 统 提供 的 工具 来 启用 Gayt ime 服 务 。 对 于 SUSE 和 openSUSE 系 统 来 说 ， 你 可 以 通过 SUSE 控 制 
中 心 来 配置 服务 ， 如 图 15-1 所 示 。Red Hat 的 版 本 〔 包 括 企业 版 Linux 和 Fedora) 也 有 一 个 类 似 的 配置 界 
面 。 在 图 15-1 中 ，daytime 服 务 同 时 针对 TCP 和 UDP 查询 进行 了 启用 。 

对 于 使 用 inetd 而 不 是 xinetd 的 系统 来 说 ， 下 面 是 从 ineta 的 配置 文件 /etc/inetd.conf 中 提取 
的 完成 相同 功能 的 配置 ，ineta 使 用 该 配置 文件 来 决定 运行 哪些 服务 器 : 


+ 
# <service_name> <sock_type> <proto> <flags> <user> <server_path> <args> 
+ 

# Echo, discard, daytime, and chargen are used primarily for testing. 

+ 


daytime stream tcp nowait root internal 
daytime dgram udp wait root internal 

* 

# These are standard services. 
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+ 

ftp stream tcp nowait root /usr/sbin/tcpd /usr/sbin/wu.ftpd 
telnet stream tcp nowait root /usr/sbin/tcpd ^ /usr/sbin/in.telnetd 
+ 


# End of inetd.conf. 

















i 
i 
$ 
3 
HJ 
ig 
ii 






WW em XU Gam namain 
w a g A 
二 
aom ne S a mae Pm a 
M Zu mes (oC Wem ente a 
Nome mm 6 M uw mw d 


E 











以 通过 编辑 文件 /etc/ineta.conf (一 行 开头 的 # 号 表示 这 是 一 个 注释 行 ) 再 重新 启动 ineta 进 程 的 方 
法 来 改变 提供 的 服务 。 你 可 以 用 ki 令 向 ineta 进 程 发 送 一 个 挂 起 信号 来 重启 该 进程 。 为 了 方便 执 
ta 将 它 的 进程 号 写 入 一 个 文件 中 。 此 外 ,你 还 可 以 使 用 killall 











# killall -HUP inetd 


15.3.0 ” 套 接 字 选项 


你 可 以 用 许多 选项 来 控制 套 接 字 连接 的 行为 ， 这 些 选项 的 数目 众多 ， 我 们 不 可 能 在 这 里 对 它们 一 
JURE. setsockopt 函数 用 于 控制 这 些 选项 ， 它 的 定义 如 下 所 示 : 
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#include «sys/socket.h» 


int setsockopt(int socket, int level, int option name, 
const void *option value, size t option len); 

你 可 以 在 协议 层次 的 不 同 级 别 对 选项 进行 设置 .如 果 想 要 在 套 接 字 级 别 设置 选项 , 就 必须 将 level 
参数 设置 为 SOL_sockET。 如 果 想 要 在 底层 协议 级 别 ( 如 TCP、UDP 等 ) 设置 选项 ， 就 必须 将 level 参 
数 设置 为 该 协议 的 编号 ”( 可 以 通过 头 文件 netinet /in.h 或 函数 getprotobyname 来 获得 )。 

option_name 参 数 指定 要 设置 的 选项 ，option_value 参 数 的 长 度 为 option_len 字 节 ， 它 用 于 设 
置 选项 的 新 值 ， 它 被 传递 给 底层 协议 的 处 理 函数 ， 并 且 不 能 被 修改 。 

在 头 文件 sys/socket .h 中 定义 的 套 接 字 级 别 选项 ， 如 表 15-5 所 示 。 

表 15-5 
$ 项 i 
50_DEBUG 打开 调试 信息 
SO, KEEPALIVE 通过 定期 传输 保持 存活 报 文 来 维持 连接 
传输 工作 








SO_DEBUG 和 SO_KEEPALIVE 用 一 个 整数 的 option_value 值 来 设置 该 选项 的 开 (1) 或 关 (0)。 
SO_LINGER 需 要 使 用 一 个 在 头 文件 sys/socket .h 中 定义 的 linger 结 构 ， 来 定义 该 选项 的 状态 以 及 套 
接 字 关闭 之 前 的 拖延 时 间 。 

setsockopt 在 成 功 时 返回 0， 失 败 时 返回 -1。 它 的 手册 页 介绍 了 更 多 的 选项 和 错误 。 
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到 目前 为 止 ， 本 章 一 直 介绍 的 是 ， 如 何 用 套 接 字 来 实现 本 地 的 和 跨 网 络 的 客户 /服务 器 系统 。 一 旦 
连接 建立 ， 套 接 字 连 接 的 行为 就 类 似 于 打开 的 底层 文件 描述 符 ， 而 且 在 很 多 方面 类 似 于 双向 管道 。 

我 们 现在 来 考虑 有 多 个 客户 同时 连接 一 个 服务 器 的 情况 。 你 已 经 看 到 ， 服 务 器 程序 在 接受 来 自 客 
户 的 一 个 新 连接 时 , 会 创建 出 一 个 新 的 套 接 字 , 而 原先 的 监听 套 接 字 将 被 保留 以 继续 监听 以 后 的 连接 。 
如 果 服 务 器 不 能 立刻 接受 后 来 的 连接 ， 它 们 将 被 放 到 队列 中 以 等 待 处 理 ; 

原先 的 套 接 字 仍 然 可 用 并 且 套 接 字 的 行为 就 像 文件 描述 符 ， 这 一 事实 给 我 们 提供 了 一 种 同时 服务 
多 个 客户 的 方法 。 如 果 服 务 器 调用 fork 为 自己 创建 第 二 份 副本 ， 打 开 的 套 接 字 就 将 被 新 的 子 进程 所 继 
承 。 新 的 子 进程 可 以 和 连接 的 客户 进行 通信 ， 而 主 服务 器 进程 可 以 继续 接受 以 后 的 客户 连接 。 这 些 改 
动 对 我 们 的 服务 器 程序 来 说 是 非常 容易 的 ， 下 面 的 实验 部 分 将 给 出 修改 过 的 服务 器 程序 。 

因为 我 们 创建 子 进程 ， 但 并 不 等 待 它们 的 完成 ， 所 以 必须 安排 服务 器 忽略 SIGCHLD 信 号 以 避免 出 
现 僵尸 进程 8。 


要 | 验 | 可 以 同时 服务 多 个 客户 的 服务 器 


(1) 这 个 程序 server4.c 的 开始 部 分 与 我 们 前 面 的 服务 器 一 脉 相 承 ， 只 是 增加 了 一 条 包含 
signal .h 头 文件 的 include 语 句 。 变 量 的 定义 和 创建 、 命 名 套 接 字 的 过 程 与 以 前 一 样 : 


(D 原 书 的 说 明 似 有 误 ， 例 如 对 于 TCP 协 议 ， 我 们 可 以 将 level 参 数 设 置 为 TPPROTO_TCP。 一 一 译 者 注 
O 原 书 似 有 误 ， 要 避免 出 现 僵尸 进程 ， 就 必须 在 服务 器 中 设置 SIGCHLD 的 信号 处 理 函 数 。 一 一 译 者 注 
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#include «sys/types.h» 
#include «sys/socket.h» 
#include <stdio.h> 
#include <netinet/in.h> 
#include <signal.h> 
finclude <unistd.h> 
#include <stdlib.h> 


int main() 

t 
int server sockfd, client sockfd; 
int server len, client len; 
struct sockaddr in server address; 
struct sockaddr in client address; 


server sockfd = socket(AF INET, SOCK STREAM, 0); 


server address.sin family - AF INET; 

server address.sin addr.s addr = htonl(INADDR ANY); 

server address.sin port = htons(9734); 

server len = sizeof(server address); 

bind(server sockfd, (struct sockaddr *)&server address, server len); 


(2) 创建 一 个 连接 队列 ， 忽 略 子 进程 的 退出 细节 ， 等 待 客户 的 到 来 : 


listen(server sockfd, 5); 





signal (SIGCHLD, SIG IGN); 


while(1) ( 
char ch; 


printf('server waitingin*); 


(3) 接受 连接 : 
client len = sizeof(client address); 
client sockfd = accept(server. sockfd, 
(struct sockaddr *)&client address, &client len); 


(4) 通过 fork 调 用 为 这 个 客户 创建 一 个 子 进程 ， 然 后 测试 你 是 在 父 进程 中 还 是 在 子 进程 中 : 
if(fork() == 0) ( 


(5) 如 果 你 是 在 子 进程 中 ,就 可 以 对 client_sockfG 上 的 客户 执行 读 / 写 操作 。5 秒 的 延迟 只 是 出 于 
演示 的 目的 : 








xead(client sockfd, &ch, 1); 
Sleep (5)7 
che; 
write(client sockfd, &ch, 1); 
close(client, sockfd) ; 
exit(0); 

} 


(6) 否则 ， 你 一 定 是 在 父 进程 中 ， 你 只 需 关闭 这 个 客户 : 


else { 
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close (cl: 
} 
了 
H 


ient sockfd); 


在 处 理 客户 请 求 时 插入 的 5 秒 延 迟 是 为 了 模拟 服务 器 的 计算 时 间或 数据 库 访问 时 间 。 如 果 在 前 面 
的 服务 器 中 这 样 做 ，client3 的 每 次 运行 都 将 花费 5 秒 钟 的 时 间 。 而 新 服务 器 可 以 同时 处 理 多 个 


client3 程 序 ， 所 花费 的 总 


$ ./server4 & 
[1] 26566 
server waiting 


时 间 将 只 有 5 秒 钟 多 一 点 。 


$ ./client3 & ./client3 & ./client3 & ps x 


[2] 26581 
[3] 26582 
[4] 26583 
server waiting 
server waiting 
server waiting 

PID TTY STAT 
26566 pts/1 
26581 pts/1 
26582 pts/1 
26583 pts/1 
26584 pts/1 
26585 pts/1 
26586 pts/1 
26587 pts/1 
$ char from server 


002001010 


char from server - 
char from server = 
ps x 

PID TTY STAT 
26566 pts/1 s 
26590 pts/1 R+ 


[2] Done 
[3]- Done 
[4]+ Done 


0:00 ./server4 
0:00 ./client3 
0:00 ./client3 
0:00 ./client3 
0:00 ps x 

0:00 ./server4 
0:00 ./server4 
0:00 ./server4 


cuu 


TIME COMMAND 

0:00 ./server4 

0:00 ps x 
./client3 
-/client3 
-/client3 


服务 器 程序 现在 将 创建 一 个 新 的 子 进程 来 处 理 每 个 客户 ， 所 以 你 将 看 到 好 几 个 服务 器 在 等 待 消 
息 ， 而 主 进程 将 继续 等 待 新 的 连接 。ps 命 令 的 输出 〔 这 里 进行 了 编辑 ) 显示 ，PID 为 26566 的 server4 
进程 正在 等 待 新 的 客户 , 而 3 个 cl1ient3 进 程 正在 由 3 个 服务 器 的 子 进程 进行 服务 。 在 经 过 5 秒 的 暂停 后 ， 
所 有 的 客户 都 得 到 了 它们 的 结果 并 结束 运行 。 服 务 器 的 子 进程 也 都 退出 ， 只 留 下 主 服务 器 进程 在 运行 。 

服务 器 程序 用 fork 函 数 来 处 理 多 个 客户 。 但 在 数据 库 应 用 程序 中 ， 这 可 能 不 是 最 佳 的 解决 方案 。 
因为 服务 器 程序 可 能 会 相当 大 ， 而 且 在 数据 库 访问 方面 还 存在 着 需要 协调 多 个 服务 器 副本 的 问题 。 事 


实 上 ， 我 们 真正 需要 的 是 ， 


如 何 让 单个 服务 器 进程 在 不 阻塞 、 不 等 待 客户 请 求 到 达 的 前 提 下 处 理 多 个 


客户 。 这 个 问题 的 解决 方案 涉及 如 何 同时 处 理 多 个 打开 的 文件 描述 符 ， 并 且 它 不 仅仅 局 限于 套 接 字 应 


用 程序 ， 请 看 下 一 节 的 sel 


ect 系 统 调用 。 
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15.4.1 select 系统 调用 


在 编写 Linux 应 用 程序 时 ， 我 们 经 常会 遇 到 需要 检查 好 几 个 输入 的 状态 才能 确定 下 一 步行 动 的 情 
况 。 例 如 ， 像 终端 仿真 器 这 样 的 通信 程序 ， 需 要 有 效 地 同时 读 取 键盘 和 串 行 口 。 如 果 是 在 一 个 单 用 户 
系统 中 ， 运 行 一 个 “ 忙 等 待 ”循环 还 是 可 以 接受 的 ， 它 不 停 地 扫描 输入 设备 看 是 否 有 数据 ， 如 果 有 数 
据 到 达 就 读 取 它 。 但 这 种 做 法 很 消耗 CPU 的 时 间 。 

select 系 统 调用 允许 程序 同时 在 多 个 底层 文件 描述 符 上 等 待 输入 的 到 达 或 输出 的 完成 )。 这 意 
昧 着 终端 仿真 程序 可 以 一 直 阻 塞 到 有 事情 可 做 为 止 。 类 似 地 ， 服 务 器 也 可 以 通过 同时 在 多 个 打开 的 套 
接 字 上 等 待 请 求 到 来 的 方法 来 处 理 多 个 客户 。 

select 函 数 对 数据 结构 fa_sec 进 行 操作 ， 它 是 由 打开 的 文件 描述 符 构成 的 集合 。 有 一 组 定义 好 
的 宏 可 以 用 来 控制 这 些 集合 : 

#include <sys/types.h> 

#include <sys/time.h> 


void FD ZERO(fd set *fdset); 

void FD CLR(int fd, fd set *fdset); 
void FD SET(int fd, fd set *fdset); 
int FD ISSET(int fd, fd set *fdset); 


顾名思义 ，FD_zERO 用 于 将 fa_set 初 始 化 为 空 集合 ，FD_SET 和 FD_CLR 分 别 用 于 在 集合 中 设置 和 
清除 由 参数 fa 传递 的 文件 描述 符 。 如 果 FD_ISsET 宏 中 由 参数 fa 指向 的 文件 描述 符 是 由 参数 faset 指 向 
的 fa_set 集 合 中 的 一 个 元 素 ，FD_ISSsET 将 返回 非 零 值 。fa_set 结 构 中 可 以 容纳 的 文件 描述 符 的 最 大 
数目 由 常量 FD_sETSsIZE 指 定 。 

select 函 数 还 可 以 用 一 个 超时 值 来 防止 无 限期 的 阻塞 。 这 个 超时 值 由 一 个 cimeval 结 构 给 出 。 这 
个 结构 定义 在 头 文件 sys/time.h 中 ， 它 由 以 下 几 个 成 员 组 成 : 

struct timeval ( 

time t tv sec; /* seconds */ 
long tv usec;  /* microseconds */ 

) 

类 型 time_t 在 头 文件 sys/types.h 中 被 定义 为 一 个 整数 类 型 。 

select 系 统 调用 的 原型 如 下 所 示 : 

#include <sys/types.h> 

#include «sys/time.h» 

int select (int nfds, fd set *readfds, fd set *writefds, ， 

fd set *errorfds, struct timeval *timeout); 

select 调 用 用 于 测试 文件 描述 符 集合 中 , 是 否 有 一 个 文件 描述 符 已 处 于 可 读 状 态 或 可 写 状态 或 错 
误 状 态 ， 它 将 阻塞 以 等 待 某 个 文件 描述 符 进入 上 述 这 些 状态 。 

参数 nfas 指 定 需要 测试 的 文件 描述 符 数目 ， 测 试 的 描述 符 范围 从 0 到 nfas-1。3 个 描述 符 集合 
可 以 被 设 为 空 指针 ， 这 表示 不 执行 相应 的 测试 。 

select 函 数 会 在 发 生 以 下 情况 时 返回 : reaGfds 集 合 中 有 描述 符 可 读 、 writefGs 集 合 中 有 描述 符 
可 写 或 errorfGs 集 合 中 有 描述 符 遇 到 错误 条 件 。 如 果 这 3 种 情况 都 没有 发 生 ，select 将 在 timeout 指 
定 的 超时 时 间 经 过 后 返回 。 如 果 timeout 参 数 是 一 个 空 指针 并 且 套 接 字 上 也 没有 任何 活动 ， 这 个 调用 
将 一 直 阻 塞 下 去 。 

当 select 返 回 时 ， 描 述 符 集合 将 被 修改 以 指示 哪些 描述 符 正 处 于 可 读 、 可 写 或 有 错误 的 状态 。 我 
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们 可 以 用 FD_IsseT 对 描述 符 进行 测试 ， 来 找 出 需要 注意 的 描述 符 。 你 可 以 修改 timeout 值 来 表明 剩余 
的 超时 时 间 ， 但 这 并 不 是 在 X/Open 规范 中 定义 的 行为 。 如 果 select 是 因为 超时 而 返回 的 话 ， 所 有 描 
述 符 集合 都 将 被 清空 。 

select 调 用 返回 状态 发 生变 化 的 描述 符 总 数 。 失 败 时 它 将 返回 -1 并 设置 errno 来 描述 错误 。 可 能 出 
现 的 错误 有 : EBADF (无 效 的 描述 符 )、EINTR( 因 中 断 而 返回 )、EINVAL (nfds 或 cimeout 取 值 错误 )。 

虽然 Linux 系 统 会 把 参数 Fimeout 指 向 的 结构 修改 为 剩余 的 超时 时 间 ， 但 大 多 数 UNIX 版 

本 不 会 这 样 做 .许多 现 有 的 使 用 selecc 函 数 的 代码 在 初始 化 imeval 结 构 后 ， 就 一 直 使 用 它 

而 不 会 重新 初始 化 它 的 内 容 。 但 这 些 代 码 在 Linux 系 统 上 可 能 会 工作 不 正常 ， 因 为 Linux 会 在 

每 次 select 调 用 返回 时 修改 timeval 结 构 。 如 果 你 正在 编写 或 移植 使 用 select 函数 的 代码 ， 

就 需要 注意 这 一 区 别 ， 并 且 总 是 重新 初始 化 Limeout 。 注意， 这 两 种 行为 都 是 正确 的 ， 但 它 

们 确实 不 同 ! 








| select 系统 调用 


下 面 这 个 程序 select .< 演示 了 select 函 数 的 使 用 方法 。 我 们 稍 后 还 会 看 到 一 个 更 复杂 的 例子 。 
这 个 程序 读 取 键盘 〈 即 标准 输入 一 一 文件 描述 符 为 0)， 超 时 时 间 设 为 2.5 秒 。 它 只 有 在 输入 就 绪 时 才 读 
取 键 盘 。 它 可 以 很 容易 地 通过 添加 其 他 描述 符 〔 如 品行 线 、 管 道 、 套 接 字 等 ) 进行 扩展 ， 具 体 做 法 取 
决 于 应 用 程序 的 需要 。 

(1) 开始 部 分 还 是 与 往常 一 样 ， 包 含 必要 的 头 文件 和 变量 声明 ， 然 后 对 inputs 进 行 初始 化 以 处 理 
来 自 键盘 的 输入 : 

#include «sys/types.h» 

#include <sys/time.h> 

finclude «stdio.h» 

include «fcntl.h» 

include «sys/ioctl.h» 

include <unistd.h> 

include <stdlib.h> 








int main() 
S 


char buffer[128 
int result, nread; 





fd set inputs, testfds; 
struct timeval timeout; 


FD_ZERO (&inputs); 
FD. SET(0, &inputs); 


(2) 在 标准 输入 scain 上 最 多 等 待 输入 2.5 秒 : 


while(1) ( 
testfds - inputs; 
timeout.tv sec = 2; 
timeout.tv usec - 500000; 


result - select(FD SETSIZE, &testfds, (fd set *)NULL, (fd set *)NULL, 
&timeout); 
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(3) 经 过 这 段 时 间 之 后 ， 我 们 对 result 进 行 测试 。 如 果 没有 和 输入， 程序 将 再 次 循环 。 如 果 出 现 一 
个 错误 ， 程 序 将 退出 运行 : 

switch(result) ( 

case 0: 
printf(*timeoutin*); 
break; 

case -1: 
perror('select*); 
exit(1); 


(4) 如 果 在 等 待 期 间 ， 你 对 文件 描述 符 采 取 了 一 些 动作 ， 程 序 就 将 读 取 标 准 输 入 stain 上 的 输入 ， 

并 在 接收 到 行 尾 字符 后 把 它们 都 回 显 到 屏幕 上 ， 当 你 输入 的 字符 是 Ctrl+D 时 ， 就 退出 程序 : 
default: 
if(FD ISSET(0,&testfds)) ( 
ioctl(0,FIONREAD, &nread); 
if(nread == 0) ( 
printf ("keyboard donein*); 
exit (0); 
) 
nread = read(0,buffer,nread); 
buffer[nread] = 0; 
printf ("read $&d from keyboard: $s*, nread, buffer); 
) 
break; 
) 
) 

) 

BARY, CANSIN timeout. Wn éEBEOE ERAF, CR AAEN 
ARMER C RICO PIRE. AKE Ms helDK bs MA REH H FEE Gl SOME A FUP PA INE E 
发 送 给 程序 ， 所 以 这 个 程序 将 在 你 按 下 回 车 键 时 把 输入 内 容 显 示 出 来 。 注 意 ， 回 车 键 本 身 也 像 其 他 
字符 一 样 被 读 取 和 处 理 ( 你 可 以 尝试 不 按 下 回 车 键 , 而 是 在 敲 入 儿 个 字符 后 按 下 组 合 键 CtrltD, 看 看 
会 怎么 样 )。 

$ ./select 

timeout 

hello 

read 6 from keyboard: hello 

fred 

read 5 from keyboard: fred 

timeout 

^D 

keyboard done 

$ 


实验 解析 

这 个 程序 用 select 调 用 来 检查 标准 输入 的 状态 。 程 序 通过 事先 安排 的 超时 时 间 每 隔 2.5 秒 打印 一 
个 imeout 信 息 ， 这 是 通过 select 调 用 返回 0 来 判断 的 。 在 文件 的 结尾 ， 标 准 输入 描述 符 被 标记 为 可 
读 ， 但 没有 字符 可 以 读 取 。 
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1542 多 客户 


我 们 的 简单 服务 器 程序 可 以 从 select 调 用 中 获得 益处 ， 通 过 用 select 调 用 来 同时 处 理 多 个 客户 
就 无 需 再 依赖 于 子 进程 了 。 但 在 把 这 个 技巧 应 用 到 实际 的 应 用 程序 中 时 ， 你 必须 要 注意 ， 不 能 在 处 理 
第 一 个 连接 的 客户 时 让 其 他 客户 等 太 长 的 时 间 。 

服务 器 可 以 让 select 调 用 同时 检查 监听 套 接 字 和 客户 的 连接 套 接 字 。 一 旦 select 调 用 指示 有 活 
动 发 生 ， 就 可 以 用 FD_IssEr 来 遍历 所 有 可 能 的 文件 描述 符 ， 以 检查 是 哪个 上 面 有 活动 发 生 。 

如 果 是 监听 套 接 字 可 读 , 这 说 明正 有 一 个 客户 试图 建立 连接 ， 此 时 就 可 以 调用 accept 而 不 用 担心 
发 生 阻 塞 的 可 能 。 如 果 是 某 个 客户 描述 符 准备 好 ， 这 说 明 该 描述 符 上 有 一 个 客户 请 求 需要 我 们 读 取 和 
处 理 。 如 果 读 操作 返回 零 字 节 ， 这 表示 有 一 个 客户 进程 已 结束 ， 你 可 以 关闭 该 套 接 字 并 把 它 从 描述 符 
集合 中 删除 。 


WOES 一 个 改进 的 多 客户 /服务 器 


(1) 作为 本 章 最 后 一 个 例子 server5 .c， 我 们 用 头 文件 sys/time.h 和 sys/ioct1.h 圭 换 掉 上 一 个 
程序 中 的 signal.h， 并 且 为 select 调 用 定义 了 一 些 变量 : 


#include <sys/types.h> 
#include <sys/socket.h> 
#include «stdio.h» 
#include «netinet/in.h» 
#include <sys/time.h> 
#include «sys/ioctl.h» 
#include «unistd.h» 
#include <stdlib.h> 


int main() 

( 
int server sockfd, client sockfd; 
int server len, client len; 
struct sockaddr in server addres 
struct sockaddr in client addr: 
int result; 
fd set readfds, testfds; 


(2) 为 服务 器 创建 并 命名 一 个 套 接 字 : 
server sockfd = socket(AF INET, SOCK STREAM, 0); 








Server address.sin family = AF INET; 

server address.sin addr.s addr = htonl(INADDR ANY); 

Server address.sin port = htons(9734); 

Server len = sizeof (server address); 

bind(server sockfd, (struct sockaddr *)&server address, server len); 
(3) 创建 一 个 连接 队列 ， 初 始 化 readfas 以 处 理 来 自 server_sockfa 的 输入 : 

listen(server sockfd, 5); 


FD. ZERO (&readfds) ; 
FD SET(server sockfd, &readfds); 
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(4) 现在 开始 等 待 客户 和 请 求 的 到 来 。 因 为 你 给 timeout 参 数 传递 了 一 个 空 指针 ， 所 以 select 调 
用 将 不 会 发 生 超 时 。 如 果 select 调 用 的 返回 值 小 于 1， 程 序 将 退出 并 报告 出 现 的 错误 : 
while(1) { 
char ch; 


int fd; 
int nread; 


testfds = readfds; 
printf ("server waiting\n"); 


result ect (FD_SETSIZE, &testfds, (fd set *)0, 
(fd set *)0, (struct timeval *) 0); 





if(result « 1) ( 
perror('server$*); 
exit(1); 

) 


(5) 一 旦 你 得 知 有 活动 发 生 ， 可 以 用 FD_ISSET 来 依次 检查 每 个 描述 符 ， 以 发 现 活动 发 生 在 哪个 描 
述 符 上 ， 
for(fd = 0; fd < FD SETSIZE; fde«) ( 
if(FD ISSET(fd,&testfds)) ( 
(6) 如 果 活 动 是 发 生 在 套 接 字 server_sockfG 上 ， 它 肯定 是 一 个 新 的 连接 请 求 ， 你 就 把 相关 的 
client_sockfaG 添 加 到 描述 符 集 合 中 : 
if(fd == server sockfd) ( 
client len = sizeof(client address); 
client sockfd = accept(server sockfd, 
(struct sockaddr *)&client address, &client len]; 
FD SET(client sockfd, &readfds); 
printf(*adding client on fd &dWn*, client, sockfd); 
) 
(7) 如 果 活 动 不 是 发 生 在 服务 器 套 接 字 上 ， 那 肯定 是 客户 的 活动 。 如 果 接 收 到 的 活动 是 close， 就 
说 明 客户 已 经 离开 ， 你 可 以 把 该 客户 的 套 接 字 从 描述 符 集合 中 删除 。 否 则 ， 就 可 以 像 前 面 的 例子 那样 
为 客户 进行 服务 。 
else ( 
ioctl(fd, FIONREAD, &nread); 


if(nread == 0) ( 
close(fd); 
FD CLR(fd, &readfds); 
printf('removing client on fd %d\n’, fd); 


H 

else ( 
read(fd, &ch, 1); 
sleep(5); 


printf ("serving client on fd d\n", fd); 
ches; 
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write(fd, &ch, 1); 


在 实际 应 用 的 程序 中 ， 最 好 用 一 个 变量 来 专门 保存 已 连接 套 接 字 的 最 大 文件 描述 符号 
( 它 不 一 定 是 最 新 连接 的 套 接 字 文 件 描述 符号 ) 这 可 以 避免 循环 检查 数 千 个 其 实 并 未 连接 的 
奏 接 字 ， 它 们 根本 不 可 能 处 于 可 读 状态 。 出 于 简洁 和 让 代码 易于 理解 的 目的 ， 我 们 在 这 里 没 
有 这 样 做 


运行 服务 器 的 这 个 版 本 时 ， 它 将 在 一 个 进程 中 对 多 个 客户 依次 进行 处 理 。 
$ ./serverS & 
[1] 26686 
server waiting 
$ ./client3 & ./client3 & ./client3 & ps x 
[2] 26689 
[3] 26690 
adding client on fd 4 
server waiting 
[4] 26691 

PID TTY STAT TIME COMMAND 
26686 pts/1 S :00 ./server5 
26689 pts/1 s :00 ./client3 
26690 pts/1 s$ -/client3 
26691 pts/1 s :00 ./client3 
26692 pts/1 R+ 
$ serving client on fd 4 
server waiting 
adding client on fd 5 
server waiting 
adding client on fd 6 
Char from server - B 
serving client on fd 5 
server waiting 
removing client on fd 4 
char from server - B 
serving client on fd 6 
server waiting 
removing client on fd 5 
server waiting 
Char from server = B 
removing client on fd 6 
server waiting 


$ 
Ei 


[2] Done /client3 
[3]- Done ./client3 
[4]* Done ./client3 
$ 


为 了 让 本 章 开头 的 类 比 更 完整 ， 表 15-6 对 套 接 字 连接 和 电话 接 入 进行 了 对 比 
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* 156 
e 话 网 络 套 接 字 
给 公司 打 电 话 ， 号 码 是 555-0828 连接 到 中 地 址 127.0.0.1 
接线 员 接听 电话 建立 起 到 远程 主机 的 连接 
要 求 转 到 财务 部 转 到 指定 端口 (9734) 
财务 主管 接听 电话 服务 器 从 select 调 用 返回 
电话 转 给 免费 账号 经 理 服务 器 调用 accepc， 在 456 编 号 上 创建 新 的 套 接 字 
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在 本 章 中 ， 我 们 重点 介绍 了 如 何 编写 与 客户 之 间 维 持 连接 的 应 用 程序 。 我 们 用 面向 连接 的 TCP 套 
接 字 来 完成 这 一 工作 。 但 在 有 些 情况 下 ， 在 程序 中 花费 时 间 来 建立 和 维持 一 个 套 接 字 连 接 是 不 必要 的 。 

早先 ， 我 们 在 程序 getGate.c 中 所 使 用 的 Gaytime 服 务 就 是 一 个 很 好 的 例子 。 我 们 首先 创建 一 个 
套 接 字 ， 然 后 建立 连接 ， 读 取 一 个 响应 ， 最 后 关闭 连接 。 在 这 一 过 程 中 ， 我 们 使 用 了 很 多 操作 步 又 ， 
仅仅 为 了 获取 一 个 日 期 。 

daytime 服 务 还 可 以 用 数据 报 通 过 UDP 来 访问 。 为 了 访问 它 ， 发 送 一 个 数据 报 给 该 服务 ， 然 后 在 
响应 中 获取 一 个 包含 日 期 和 时 间 的 数据 报 。 这 一 过 程 非常 简单 。 

当 客 户 需 要 发 送 一 个 短小 的 查询 请 求 给 服务 器 ， 并 且 期 望 接收 到 一 个 短小 的 响应 时 ， 我 们 一 般 就 
使 用 由 UDP 提 供 的 服务 。 如 果 服 务 器 处 理 客户 请 求 的 时 间 足 够 短 ， 服 务 器 就 可 以 通过 一 次 处 理 一 个 客 
户 请 求 的 方式 来 提供 服务 ， 从 而 允许 操作 系统 将 客户 进入 的 请 求 放 入 队列 。 这 简化 了 服务 器 程序 的 编 
写 。 

因为 UDP 提供 的 是 不 可 靠 服务 ， 所 以 你 可 能 发 现 数据 报 或 响应 会 丢失 。 如 果 数据 对 于 你 来 说 非常 
重要 ， 就 需要 小 心 编写 UDP 客户 程序 ， 以 检查 错误 并 在 必要 时 重 传 。 实 际 上 ，UDP 数 据 报 在 局 域 网 中 
是 非常 可 靠 的 。 

为 了 访问 由 UDP 提供 的 服务 ， 你 需要 像 以 前 一 样 使 用 套 接 字 和 close 系 统 调用 ， 但 你 需要 用 两 个 
数据 报 专用 的 系统 调用 senarco 和 recvfrom 来 代替 原来 使 用 在 套 接 字 上 的 reaa 和 write 调用 。 

下 面 是 一 个 修改 过 的 gecaare.c 版 本 ， 它 通过 UDP 数据 报 服务 来 获取 数据 。 对 先前 版 本 的 改动 将 
以 阴影 显示 。 


/* Start with the usual includes and declarations. */ 









*include «sys/socket.h» 
*include «netinet/in.h» 
#include «netdb.h» 
#include «stdio.h» 
*include «unistd.h» 
#include «stdlib.h» 


int main(int argc, char *argv[l) 
t 
char *host; 
int sockfd; 
int len, result; 
struct sockaddr in address; 
struct hostent *hostinfo; 
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struct servent *servinfo; 
char buffer[128]; 


if(argc == 1) 

host = "localhost"; 
else 

host = argv[1]; 


/* Find the host address and report an error if none is found. */ 


hostinfo = gethostbyname(host); 
if(!hostinfo) ( 
fprintf(stderr, "no host: %s\n", host); 
exit(1); 
) 


/* Check that the daytime service exists on the host. */ 


servinfo = getservbyname(*daytime*, "udp*); 
if(!servinfo) ( 
fprintf (stderr, "no daytime service\n"); 
exit(1); 
) 


printf('daytime port is &dWn*, ntohs(servinfo -> s_port)); 
/* Create a UDP socket. */ 

sockfd = socket(AF INET, SOCK DGRAM, 0); 
/* Construct the address for use with sendto/recvfrom... */ 


address.sin family - AF INET; 

address.sin port = servinfo -> s port; 

address.sin addr - *(struct in addr *)*hostinfo -» h addr list; 
len = sizeof (address); 


result = sendto(sockfd, buffer, 1, 0, (struct sockaddr *)&address, len); 
result = recvfrom(sockfd, buffer, sizeof(buffer), 0, 

(struct sockaddr *)&address, &len); 
buffer[result] = '\0 
printf ("read &d byte: 





ès", result, buffer); 


close (sockfd) ; 
exit(0); 
* 


如 你 所 见 ， 需 要 改动 的 地 方 非常 少 。 像 以 前 一 样 ， 我 们 用 getservbyname 来 查找 daytime 服 务 ， 
但 通过 请 求 UDP 协 议 来 指定 数据 报 服务 。 我 们 使 用 带 有 sock_DGRAM 参 数 的 socket 调用 来 创建 一 个 数 
据 报 套 接 字 。 我 们 还 是 采用 与 以 前 一 样 的 方式 来 构建 目标 地 址 ， 但 现在 需要 发 送 一 个 数据 报 而 不 是 仅 
仅 从 套 接 字 上 读 取 数 据 。 

因为 我 们 并 没有 明确 地 建立 一 条 到 指定 UDP 服务 的 连接 ,所 以 必须 用 某 些 方式 让 服务 器 知道 你 需 
要 接收 一 个 响应 。 在 本 例 中 ， 给 服务 器 发 送 一 个 数据 报 〈 在 这 里 ， 从 准备 接收 响应 的 缓存 区 中 发 送 一 
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个 字 节 的 数据 )， 它 返回 包含 日 期 和 时 间 的 响应 。 
sendto 系 统 调用 从 buffer 缓 存 区 中 给 使 用 指定 套 接 字 地 址 的 目标 服务 器 发 送 一 个 数据 报 。 它 的 
原型 如 下 所 示 : 
int sendto(int sockfd, void *buffer, size t len, int flags, 
struct sockaddr *to, socklen t tolen); 


在 正常 应 用 中 ，flags 参 数 一 般 被 设置 为 0。 
recvfrom 系 统 调用 在 套 接 字 上 等 待 从 特定 地 址 到 来 的 数据 报 ， 并 将 它 放 入 buffer 缓 存 区 。 它 的 
原型 如 下 所 示 : 


int recvfrom(int sockfd, void *buffer, size t len, int flags, 
struct sockaddr *from, socklen t *fromlen); 


同样 ， 在 正常 应 用 中 ，f1ags 参 数 一 般 被 设置 为 0。 
为 了 让 示例 程序 变 得 简短 ， 我 们 省 略 了 错误 处 理 。 当 错误 发 和 时，sendto 和 recvfrom 都 将 返回 
-1 并 设置 errno。 可 能 的 错误 见 表 15-7。 








表 15-7 
errno 值 LEN] 
EBADF 传递 了 一 个 无 效 的 文件 描述 符 
EINTR 产生 一 个 信号 


除非 用 fcnt1 将 套 接 字 设 置 为 非 阻塞 方式 〈 正 如 在 前 面 的 接受 TCP 连 接 中 看 到 的 那样 )， 否 则 
recvfrom 调 用 将 一 直 阻塞 。 我 们 可 以 用 与 前 面 的 面向 连接 服务 器 一 样 的 方式 ， 通 过 select 调 用 和 超 
时 设置 来 判断 是 否 有 数据 到 达 套 接 字 。 此 外 ， 还 可 以 用 alarm 时 钟 信号 来 中 断 一 个 接收 操作 (参见 第 
11 章 )。 


15.6 ”小结 


在 本 章 中 ， 我 们 介绍 了 另 一 种 进程 间 通 信和 的 方法 : 套 接 字 。 i 
行 的 分 布 式 客户 /服务 器 应 用 程序 。 我 们 简要 介绍 了 一 些 主机 数据 
特 网 守护 进程 来 处 理 标准 系统 服务 的 。 我 们 开发 了 几 个 客户 /服务 器 示 
方法 。 

最 后 , 我 们 介绍 了 select 系 统 调用 , 它 允 许 一 个 程序 同时 在 多 个 打开 的 文件 描述 符 和 套 接 字 上 等 
待 输 入 和 输出 活动 的 发 生 。 





它 可 以 开发 出 真正 可 以 跨 网 络 运 
函数 以 及 Linux 是 如 何 使 用 因 
例 程序 来 演示 网 络 和 多 客户 处 理 
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TED I EX 我 们 介绍 了 Linux 程 序 设计 中 与 复杂 的 底层 问题 相关 的 主题 。 现 在 ， 我 
们 将 为 应 用 程序 中 增添 一 些 活力 ， 介 绍 如 何在 应 用 程序 中 加 入 图 形 用 户 界面 (GUID)。 在 本 
章 和 下 一 章 中 ， 我 们 将 介绍 Linux 中 两 个 最 受 欢迎 的 GUI 库 ， GTK+ 和 KDE/Qt。 这 两 个 库 对 应 两 个 最 受 
欢迎 的 Linux 桌 面 环境 : GNOME (GTK+) 和 KDE。 

Linux 中 所 有 的 GUI 库 都 基于 被 称 作 X 视 窗 系统 (更 常见 的 称呼 是 X11 或 者 X) 的 底层 视窗 系统 。 因 
此 ， 在 讲述 GNOME/GTK+ 的 具体 细节 之 前 ,我 们 将 首先 简要 介绍 X 视 窗 系统 是 如 何 运行 的 ， 并 帮助 读 
者 理解 该 视窗 系统 的 不 同 层次 是 如 何 相互 配合 从 而 创建 桌面 的 。 

本 章 将 涵盖 以 下 内 容 : 

O X 视 窗 系统 

O GNOME/GTK+ 简 介 

口 GTK+ 构 件 

口 GNOME 构 件 和 菜单 

口 对 话 框 

口 用 GNOME/GTK+ 编 写 CD 数 据 库 GUI 


16.1 X 视 窗 系统 简介 


如 果 你 曾经 在 Linux 中 使 用 过 桌面 视窗 系统 ， 那 么 你 很 可 能 使 用 的 是 X 一 一 一 个 开源 图 形 化 系统 。 
X 的 一 个 最 富有 创新 性 也 最 令 人 感到 肖 阅 的 特征 ， 是 它 固守 机 制 的 要 求 ， 而 不 是 策略 的 它 没有 
定义 用 户 界面 ， 但 提供 了 创建 用 户 界面 的 手段 。 这 意味 着 你 可 以 自由 地 创建 自己 的 整个 桌面 环境 ， 随 
意 进行 试验 和 创新 。 但 它 也 在 很 长 一 段 时 间 内 妨碍 了 Linux 和 UNIX 系 统 上 用 户 界面 的 发 展 。 在 这 一 片 
相对 空白 的 领域 中 ， 两 个 桌面 项 目 逐 渐 浮 现成 为 Linux 用 户 的 最 爱 ，GNOME 和 KDE。 然 而 ，Linux 桌 
面 并 不 始 于 X， 也 不 终于 X。 事 实 上 ，Linux 中 的 桌面 是 一 个 相当 模糊 的 东西 ， 并 没有 哪个 项 目 或 是 组 
织 在 发 布 的 权威 版 本 。 当 前 主流 的 安装 包含 了 大 量 的 库 、 工 具 和 应 用 程序 ， 它 们 被 总 称 为 “桌面 "。 

X 拥 有 悠久 而 辉煌 的 历史 ， 它 最 初 于 20 世 纪 80 年 代 早 期 由 MIT 开 发 。X 为 当时 的 高 端 科 学 工作 站 提 
供 一 个 统一 的 视窗 系统 ， 那 些 工作 站 都 是 非常 昂贵 的 、 用 于 复杂 计算 的 庞然大物 。 

20 世 纪 90 年 代 ， 随 着 硬件 价格 的 下 降 ， 一 些 爱好 者 将 X 移 植 到 廉价 的 家 用 PC 上 ， 这 个 项 目 后 来 被 
称 为 XFree86 (Intel 和 其 他 公司 生产 的 PC 处 理 器 被 称 为 x86 处 理 器 ). 目前 在 Linux 上 发 布 的 都 是 XFree86 
的 衍生 产品 ， 大 多 数 Linux 发 行 版 使 用 的 是 一 个 被 称 为 X.Org 的 X 变 体 。 

XX 视窗 系统 被 分 为 硬件 级 和 应 用 程序 级 组 件 ， 它 们 分 别 被 称 为 X 服 务 器 和 X 客 户 端 。 这 些 组 件 使 用 
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XX 协议 进行 通信 。 在 下 面 几 节 中 ， 我 们 将 依次 介绍 它们 。 
16.1.1 X 服 务 器 


X 服 务 器 运行 在 用 户 的 本 地 机 器 上 ， 它 在 屏幕 上 完成 低层 的 绘图 操作 。 其 名 字 中 的 服务 器 部 分 经 
常 让 人 困惑 : X 服 务 器 运行 在 用 户 的 桌面 PC 上 ， 而 X 客 户 端 既 可 以 运行 在 用 户 的 桌面 PC 上 ， 也 可 以 运 
行 在 网 络 中 的 其 他 系统 〈 包 括 服务 器 ) 上 。 这 一 颠倒 的 术语 只 有 在 你 理解 它 时 才 有 意义 ， 但 它 通常 看 
上 去 有 点 反 其 道 而 行 之 的 感觉 。 

因为 X 服 务 器 直接 与 显卡 交互 ， 所 以 你 必须 使 用 一 个 适合 本 机 显卡 的 X 服 务 器 ， 并 配置 好 合适 的 
分 辩 率 、 刷 新 率 、 颜 色 深度 等 。 其 配置 文件 名 是 xorg .conf 或 者 Xfree86Config。 在 过 去 ， 你 通常 需 
要 手动 编辑 配置 文件 才能 使 得 X 正 常 工作 。 幸 运 的 是 ， 现 在 的 Linux 发 行 版 可 以 自动 检测 正确 的 设置 ， 
这 节省 了 用 户 的 时 间 ， 也 解决 了 很 多 让 人 头疼 的 问题 。 

X 服 务 器 通过 鼠标 和 键盘 监听 用 户 输入 ， 并 将 键盘 按键 和 鼠标 点 击 传输 给 X 客 户 端 应 用 程序 。 这 
被 称 为 事件 〈event)， 它 们 构成 GUI 编程 的 一 个 关键 元 素 。 我 们 将 在 本 章 后 面 详细 介绍 事件 及 
其 GTK+ 逻 辑 扩展 一 一 信号 (signal). 


161.2 X 客 户 端 


X 客 户 端 是 以 X 视 窗 系统 作为 GUI 的 任何 程序 ,例如 xterm、xcalc 和 类 似 Abiword 的 更 高 级 的 应 用 程 
序 。 通 常情 况 下 ，X 客 户 端 等 候 X 服 务 器 传送 的 用 户 事件 ， 然 后 通过 给 X 服 务 器 发 送 重 绘 消息 来 响应 。 
X 客 户 端 不 需要 和 X 服 务 器 运行 在 同一 台 机 器 上 . 


16.1.3 X 协 议 

X 客 户 端 和 X 服 务 器 使 用 X 协 议 进 行 通信 ， 这 使 得 客户 端 和 服务 器 可 以 通过 网 络 分 离 。 例 如 ， 你 可 
以 在 因特网 或 者 加 密 的 虚拟 专用 网 VPN) 上 的 一 台 远程 计算 机 上 运行 X 客 户 端 应 用 程序 。 对 于 绝 大 
多 数 个 人 Linux 系 统 来 说 ，X 客 户 端 和 X 服 务 器 都 运行 在 同一 个 系 
16.1.4 Xlib 库 

Xlib 是 X 客 户 端 则 接 用 于 产生 X 协 议 消息 的 库 。 它 提供 一 个 非常 底层 的 API 供 客户 端 在 X 服 务 器 上 
绘制 非常 基本 的 元 素 ， 并 响应 最 简单 的 输入 。 我 人 强调 ，Xlib 是 一 个 非常 底层 的 库 ， 即 使 使 用 Xlib 
库 创建 一 个 像 菜单 这 样 非常 简单 的 东西 ， 也 要 耗费 程序 员 很 大 的 精力 ， 它 需要 数 百 行 的 代码 。 

GUI 程序 员 不 应 该 直接 使 用 Xlib 进 行 编程 。 你 需要 一 个 API 使 得 诸如 菜单 、 按 钮 和 下 拉 式 列表 等 
GUI 元 素 能 够 被 简单 方便 地 创建 。 简 而 言 之 ， 这 就 是 X 工 具 包 的 作用 。 


161.5 X 工 具 包 


X 工 具 包 是 一 个 GUI 库 ，X 客 户 端 可 以 利用 它 来 极 大 地 简化 窗口 、 菜 单 和 按钮 等 的 创建 。 使 用 工具 
包 ， 你 通过 一 次 函数 调用 就 可 以 创建 按钮 菜单、 框架 等 类 似 的 元 素 。 诸 如 此 类 的 GUI 元 素 被 统称 为 
构件 《widget)， 你 在 所 有 的 现代 GUI 库 中 都 能 找到 这 个 通用 术语 。 

你 有 儿 十 个 X 工 具 包 可 选 ， 每 个 工具 包 都 有 其 长 处 和 短处 。 选 择 哪个 包 对 于 应 用 程序 来 说 是 一 个 
重要 的 设计 决定 ， 你 应 该 考虑 以 下 一 些 因素 。 

口 应 用 程序 针对 的 用 户 是 谁 ? 

O 用 户 是 否 已 经 安装 好 了 工具 包 库 ? 
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O 该 工具 包 是 否 支持 其 他 流行 的 操作 系统 ? 

O 该 工具 包 使 用 什么 软件 许可 证 ， 该 许可 证 是 否 与 你 期 望 的 用 法 一 致 ? 

O 该 工具 包 是 否 支持 你 的 编程 语言 ? 

O 该 工具 包 是 否 具 有 现代 的 界面 外 观 ? 

历史 上 最 流行 的 工具 包 有 Motif、OpenLook 和 Xt， 但 是 它们 大 多 已 经 被 技术 上 更 先进 的 GTK+ 和 
Qt 工具 包 所 取代 ， 这 两 者 分 别 构成 了 GNOME 和 KDE 桌 面 的 基础 。 


16.1.0 ”窗口 管理 器 


X 中 最 后 一 个 部 分 就 是 窗口 管理 器 ， 它 负责 定位 屏幕 上 的 窗口 。 窗口 管理 器 通常 支持 独立 的 “ 工 
作 区 ”， 这 些 工作 区 将 桌面 分 割 ， 增 大 用 户 可 以 交互 的 区 域 。 窗口 管理 器 还 负责 装饰 每 个 窗口 ， 通 常 
这 些 装饰 由 一 个 框架 和 一 个 带 有 最 大 化 、 最 小 化 和 关闭 图 标的 标题 栏 组 成 。 窗口 管理 器 提供 了 桌面 的 
部 分 界面 外 观 ， 例 如 窗口 标题 栏 。 

常见 的 窗口 管理 器 包括 下 面 儿 个 。 

O Metacity: GNOME 桌 面 的 默认 窗口 管理 器 。 

O KWin: KDE 桌 面 的 默认 窗口 管理 器 。 

O Openbox: 旨 在 节约 资源 ， 用 于 较 老 的 、 较 慢 的 系统 。 

O Enlightenment; 一 个 有 着 出 色 图 形 和 效果 的 窗口 管理 器 。 

就 和 X 中 的 一 切 一 样 ， 你 也 可 以 切换 窗口 管理 器 。 但 大 多 数 用 户 都 使 用 桌面 环境 自 带 的 窗口 管 
理 器 。 


16.1.7 创建 GUI 的 其 他 方法 一 一 平台 无 关 的 窗口 API 


其 他 一 些 不 是 特定 于 Linux 的 创建 GUI 的 方法 也 是 值得 一 提 的 。 有 些 语 言 本 身 就 支持 GUI， 并 且 可 
以 在 Linux 下 使 用 。 
口 Java 语 言 使 用 Swing 和 较 老 的 AWT APl 来 支持 创建 GUI。 Java GUI 的 界面 外 观 并 不 是 所 有 人 都 喜 
欢 ， 而 且 在 配置 低 的 机 器 上 ， 它 的 界面 感觉 比较 笨拙 ， 而 且 响应 迟钝 。 使 用 Java 的 一 大 好 处 是 ， 
编 详 好 的 Java 代 码 可 以 在 任何 具有 Java 虚 拟 机 的 平台 (包括 Linux、Windows、Mac OS 以 及 移动 
设备 ) 上 运行 而 无 需 任何 改动 。 更 多 信息 请 访问 http://java.sun.com。 
口 C# 是 一 个 与 Java 非 常 类 似 的 编程 语言 。Linux 系 统 需 要 安装 来 自 Mono 项 目 Chttp://www.mono- 
project.com) 的 C# 公 共 语 言 运行 时 环境 (CLR)。Mono 平 台 上 的 C# 还 支持 Windows Forms 《 它 
也 在 Windows 中 使 用 )， 以 及 一 个 被 称 为 Gtk# 的 对 GTK+ 工 具 包 的 特殊 绑 定 。 
口 TeyTk 是 一 个 脚本 语言 ， 它 非常 适 于 快速 开发 GUI， 并 支持 X、Windows 和 Mac OS. 当 需 要 快 
速 原型 开发 ， 或 开发 一 些小 工具 《需要 脚本 的 简单 性 和 可 维护 性 ) 时 ，Tck/Tk 非 常 棒 。 有 关 该 
语言 的 更 详细 资料 请 见 http://tcl.tk。 
口 Python 也 是 一 个 脚本 语言 。 你 可 以 在 Python 中 使 用 TeclrTKk 的 Tk 部 分 ,或 使 用 Python 的 GTK+ 绑 定 
来 编写 GTK+ 程 序 。 有 关 该 语言 的 更 多 资料 请 见 http:/www .python.org。 
口 Perl 是 另 一 个 常见 的 Linux 脚 本 语言 。 你 可 以 在 Perl 中 使 用 TelTk 的 Tk 部 分 ， 这 被 称 为 PeryTk。 
有 关 Perl 的 更 多 资料 请 见 http://www.perl.org/。 
这 些 语言 带 来 的 平台 无 关 特 性 是 需要 付出 代价 的 。 与 本 地 应 用 程序 之 间 共 享 信息 (例如 使 用 “ 拖 
放 ” 技术) 会 比较 困难 ， 而 且 保存 配置 通常 必须 使 用 专用 方法 而 非 桌面 标准 方法 。 有 时 Java 软件 的 销 
售 商 通过 附带 平台 相关 的 扩展 来 回避 这 些 问 题 。 
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16.2 GTK+ 简 介 


了 解 了 X 视 窗 系统 之 后 ， 下 面 我 们 该 介绍 GTK+ 工 具 包 了 。GTK+ 一 开始 是 作为 流行 的 GNU 图 像 处 
理 程序 GIMP 的 一 部 分 产生 的 ， 这 也 是 GTK 得 名 的 原因 (Gimp ToolKit 的 缩写 ) 。 因 为 GTK+ 已 经 发 展 
并 逐渐 成 为 功能 最 强大 和 最 受 欢 迎 的 工具 包 之 一 , 所 以 GIMP 程 序 设计 者 颇 有 远见 地 将 GTK+ 变 为 一 个 
独立 的 项 目 。GTK+ 项 目的 主页 是 http://www.gtk.org。 
简 而 言 之 ，GTK+ 是 一 个 函数 库 ， 它 提供 了 一 组 已 制作 好 的 被 称 为 构件 的 组 件 。 你 通过 
简单 易 用 的 函数 调用 把 这 些 组 件 和 应 用 程序 远 辑 组 合 在 一 起 , 从 而 极 大 地 简化 了 GUI 的 创建 。 


尽管 GTK+ 是 一 个 与 GIMP 一 样 的 GNU 项 目 ,但 是 它 使 用 的 是 更 自由 的 LGPL 许 可 证 (Lesser General 
Public License)。LGPL 人 允许 人 们 使 用 GTK+ 来 编写 软件 (包括 源 代码 不 开放 的 私有 软件 ) 而 不 用 支付 
任何 使 用 费 、 版 税 及 受到 其 他 限制 。GTK+ 许 可 证 所 提供 的 自由 度 与 它 的 竞争 者 Qt 〈 下 一 章 的 主题 ) 
恰 成 对 比 ， 后 者 的 GPL 许 可 证 禁止 使 用 Qt 开发 商业 软件 (你 必须 购买 一 个 商业 Qt 许可 证 )。 

GTK+ 完 全 是 用 C 语 言 编写 的 ， 而 且 绝 大 多 数 GTK+ 软 件 也 是 用 C 语 言 编写 的 。 但 幸运 的 是 ， 有 许 
多 语言 绑 定 使 你 可 以 在 自己 偏好 的 语言 中 使 用 GTK+， 这 些 语言 包括 C++、Python、PHP、Ruby、Perl、 
C# 和 Java。 

GTK+ 本 身 是 建立 在 一 组 其 他 函数 库 之 上 的 ， 如 下 所 示 。 

O GLib: 提供 底层 数据 结构 、 类 型 、 线 程 支持 、 事 件 循环 和 动态 加 载 。 

O GObject: 使 用 C 语 言 而 不 是 C++ 语言 实现 了 一 个 面向 对 象 系统 。 

O Pango: 支持 文本 泻 染 和 布局 。 

O ATK: 用 来 创建 可 访问 应 用 程序 , 并 允许 用 户 使 用 屏幕 阅读 器 和 其 他 协助 工具 来 运行 你 的 应 用 

程序 。 

O GDK 〈GIMP 绘 图 工具 包 );， 在 Xlib 之 上 处 理 底层 图 形 泻 染 。 

口 GdkPixbuf; 在 GTK+ 程 序 中 帮助 处 理 图 像 。 

O Xlib: 在 Linux 和 UNIX 系 统 上 提供 底层 图 形 。 


16.2.1 GLib 类 型 系统 


如 果 你 阅读 过 GTK+ 代 码 ， 你 可 能 会 很 奇怪 为 什么 代码 中 有 许多 以 字母 g 开 头 的 C 语 言 数据 类 型 ， 
如 gint、gchar、gshort， 还 有 一 些 像 gint32 和 gpointer 这 样 不 熟悉 的 类 型 。 这 是 因为 GTK+ 建 立 在 
一 个 可 移植 的 C 语 言 库 Glib 和 GObject 之 上 ， 它 们 定义 了 这 些 类 型 来 实现 跨 平台 开发 。 

Glib 和 GObject 提 供 了 一 组 数据 类 型 、 函 数 和 宏 的 标准 替代 集 来 进行 内 存 管理 和 处 理 常 见 任务 ， 从 
而 实现 跨 平 台 开 发 。 这 些 数 据 类 型 、 函 数 和 宏 意 味 着 作为 GTK+ 程 序 员 ， 我 们 可 以 确信 我 们 的 代码 能 
可 靠 地 移植 到 其 他 平台 和 体系 结构 上 。 

Glib 还 定义 了 一 些 方便 的 常量 : 


#include <glib/gmacros.h> 





#define FALSE 0 
#define TRUE !FALSE 


这 些 附 加 的 数据 类 型 基本 上 是 标准 C 语 言 数 据 类 型 的 替代 (为 了 一 致 性 和 可 读 性 ) ， 以 及 用 于 确 
保 跨 平台 字 节 长 度 不 变 。 
口 gint、guint、gchar、guchar、glong、gulong、gfloat 和 gdouble 是 标准 C 语 言 数据 类 型 
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的 简单 替代 (为 一 致 性 考虑 ) 。 
口 gpointer 与 (void *) 同 义 。 
O gboolean 用 于 表示 布尔 类 型 的 值 ， 它 是 对 int 的 一 个 包装 。 
口 gint8、guint8、gint16、guint16、gint32 和 guint32 是 保证 字 节 长 度 的 有 符号 和 无 符号 类 
型 。 
使 用 Glib 和 GObjeet 儿 乎 是 透明 的 ， 这 一 点 很 有 用 。Glib 在 GTK+ 中 被 广泛 地 使 用 ， 因 此 ， 如 果 你 有 
一 个 可 以 正常 工作 的 GTK+， 你 将 发 现 GLib 也 被 安装 了 。 在 使 用 GTK+ 编 程 时 ， 你 甚至 不 需要 明确 地 包 
含 头 文件 gl ib.h， 这 一 点 你 将 在 本 章 后 面 看 到 。 
16.22 ”GTK+ 对 象 系统 


编 过 GUI 程序 的 人 都 能 理解 ， 我 们 为 什么 说 GUI 库 非常 适合 于 使 用 面向 对 象 编程 的 范 型 ， 以 至 于 
所 有 的 现代 工具 包 (包括 GTK+) 都 是 以 一 种 面向 对 象 的 风格 编写 的 。 
尽管 GTK+ 是 完全 用 C 语 言 编写 的 ， 但 是 它 通过 cobjecc 库 支持 对 象 和 面向 对 象 编程 。 这 个 库 通过 
宏 来 支持 对 象 继承 和 多 态 。 
让 我 们 看 一 个 继承 和 多 态 的 例子 ， 它 取 自 GTK+ API 文 档 中 的 Gtkwindow 的 对 象 屋 次 结构 ; 
Gobject 
*----GInitiallyUnowned 
*----GtkObject 
*----GtkWidget 
*----GtkContainer 
*----GtkBin 
*----GtkWindow 


这 个 对 象 列表 表明 Gtkwindow 是 GtkBin 的 一 个 子 类 , 因此 所 有 带 GtkBin 参 数 的 函数 在 调用 时 都 可 
以 带 Gtkwindow 参 数 。 同 样 地 ，GtkBin 继 承 自 Gtkcontainer， 而 后 者 继承 自 Gtkwiaget。 

为 方便 起 见 ， 所 有 构件 创建 函数 都 返回 一 个 Gtkwiaget 的 类 型 。 例 如 : 

GtkWidget* gtk window new (GtkWindowType type); 

假设 你 创建 了 一 个 Gekwinaow, 并 想 把 返回 值 传 给 某 个 需要 以 Gtkcontainer 作 为 参数 的 函数 (如 
gtk container add) : 

void gtk container add (GtkContainer *container, GtkWidget *widget); 

你 需要 使 用 宏 GTk_CONTAINER 在 Gtkwiaget 和 Gtkcontainer 之 间 进 行 类 型 转换 : 

GtkWidget * window = gtk window new(GTK GTK WINDOW. TOPLEVEL) ; 

gtk container add(GTK CONTAINER(window), awidget); 

后 面 将 讲解 这 些 函 数 的 作用 。 现 在 你 只 需 知道 宏 是 经 常 被 使 用 的 ， 每 一 种 可 能 的 类 型 转换 都 有 对 
应 的 宏 存在 。 

如 果 你 还 不 是 很 清楚 ， 请 不 要 担心 。 掌 担 GNOME/GTK+ 并 不 需要 你 理解 面向 对 象 编程 
的 所 有 细节 .事实 上 ,利用 C 语 言 的 知识 背景 就 可 以 让 你 轻松 学 习 面 向 对 象 编程 思想 和 其 优点 


16.2.3 GNOME 简介 


GNOME 是 一 项 1997 年 启动 的 项 目的 名 称 ， 该 项 目 由 GIMP 程 序 员 发 起 ， 目 标 是 为 Linux 创 建 一 个 
统一 的 桌面 。 人 们 有 一 个 普遍 的 共识 :缺乏 一 个 一 致 的 策略 阻碍 了 Linux 用 作 和 桌面 平台 的 进程 。 那 时 ， 
Linux 桌 面 就 像 拓 莞 前 的 美国 西部 一 样 ， 没 有 整体 的 标准 和 约定 的 做 法 ， 却 有 “无 所 不 为 ”的 程序 员 
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精神 。 由 于 没有 一 个 权威 组 织 对 桌面 菜单 、 一 致 的 界面 外 观 、 文 档 、 翻 译 等 进行 控制 ， 所 以 说 好 听 点 ， 
Linux 桌 面 的 新 手 会 感到 很 迷惑 ， 说 难听 点 ， 这 样 的 桌面 根本 无 法 使 用 。 

GNOME 团 队 着 手 创建 一 个 完全 遵循 GPL 许可 证 的 Linux 桌 面 ， 用 统一 和 一 致 的 风格 来 开发 工具 和 
配置 程序 ， 同 时 促进 程序 间 通 信 、 打 印 、 会 话 管理 、GUI 程 序 设计 最 佳 实践 等 方面 标准 的 制定 。 

他 们 努力 的 结果 是 显而易见 的 一 一 现在 GNOME 已 成 为 Fedora、Red Hat、Ubuntu 以 及 openSUSE 等 
发 行 版 的 默认 Linux 桌 面 的 基础 〈 见 图 16-1)。 
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图 16-1 


GNOME 最 初代 表 的 是 GNU Network Object Model Environment (GNU 网 络 对 象 模型 环境 )， 这 
反映 了 GNOME 早 期 的 一 个 目标 , 即 为 Linux 引 入 一 个 像 Microsoft OLE 一 样 的 对 象 框架 ， 这 样 你 就 可 
以 在 字 处 理 文档 中 嵌入 电子 表格 了 。 现 在 ，GNOME 的 设计 目标 发 生 了 变化 ,我 们 所 知道 的 GNOME 
指 的 是 整个 桌面 环境 ， 它 包括 一 个 启动 应 用 程序 的 面板 、 一 套 程序 和 实用 工具 、 编 程 库 以 及 开发 者 
支持 特性 。 

在 开始 编程 之 前 ， 你 需要 确认 所 有 库 都 已 安装 好 。 

16.2.4 安装 GNOME/GTK+ 开 发 库 


-个 带 有 标准 应 用 程序 和 GNOME/GTK+ 开 发 库 的 完整 GNOME 桌 面包 括 60 多 个 软件 包 。 因此， 从 
头 安装 GNOME, 无 论 是 手工 安装 还 是 从 源 代码 安装 , 都 是 一 个 令 人 晴 惧 的 过 程 。 幸运 的 是 , 现代 Linux 
发 行 版 都 有 很 优秀 的 软件 包 管理 工具 ， 它 使 得 安装 GNOME/GTK+ 及 其 开发 库 变 得 轻而易举 。 
在 Red Hat 与 Fedora Linux 中 ， 你 通过 点 击 应 用 程序 菜单 按钮 (在 左上 角 ) ， 并 选择 Add/Remove 
Software 增加 /删除 软件 ) 来 打开 软件 包 管理 工具 .软件 包 管理 工具 打开 后 ( 见 图 16-2), 请 确认 GNOME 
Software Development (GNOME 软 件 开发 ) 检查 框 被 选中 。 它 在 Development (FR) 区 域 中 。 


在 本 章 中 ， 你 将 使 用 GNOME/GTK+ 2， 因 此 请 确认 你 安装 了 2.x 版 本 的 库 。 ] 
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图 16-2 


对 使 用 RPM 包 的 发 行 版 来 说 ， 你 至 少 要 安装 如 下 的 RPM 包 : 
gtk2-2.10.11-7.fc7.rpm 
gtk2-devel-: 





在 本 例 中 ， 文 件 名 中 的 fc7 指 的 是 Fedora 7 Linux 发 行 版 。 你 的 系统 显示 的 名 字 可 能 稍微 
不 同 。 
在 Debian 或 基于 Debian 的 系统 如 Ubuntu》 中 ， 你 可 以 使 用 apt-get 命 令 从 各 种 镜像 站 点 中 安装 
GNOME/GTK+。 更 多 细节 请 访问 http:/www.gnome.org。 
另外 ， 你 也 可 以 尝试 运行 一 下 GTK+ 的 演示 程序 ， 它 们 展示 了 所 有 构件 的 外 观 〔 见 图 16-3); 
$ gtk-demo 
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对 每 个 构件 ， 你 都 可 以 看 到 一 个 Info 标 签 和 一 个 Source 标 答 。 后 者 显示 了 使 用 指定 构件 
的 实际 C 语 言 源 代 码 。 这 里 提供 了 大 量 的 示例 - 


实验 个 空白 的 Gtkwindow 

让 我 们 以 一 个 最 简单 的 GUI 程 序 来 开始 GTK+ 编 程 吧 ， 它 用 于 显示 一 个 窗口 。 你 将 看 到 GTK+ 库 的 
实际 使 用 情况 ， 并 看 到 你 可 以 从 很 少 的 代码 中 获得 多 少 功能 。 

(D 输入 程序 的 代码 ， 并 把 它 保存 为 gtkl .cs 


finclude «gtk/gtk.h» 





int main (int argc, char *argv(]) 
( 
GtkWidget *window; 


gtk init(&argc, &argv); 
window = gtk window new(GTK, WINDOW TOPLEVEL) ; 
gtk widget show(window); 

gtk main (); 


return 0; 


(2) 为 编译 gck1.c， 请 输入 : 

$ gcc gtkl.c -o gtkl ‘pkg-config --cflags --libs gtk«-2.0" 
注意 ， 输 入 的 是 反 引 号 ， 而 不 是 单 引号 。 请 记 住 反 引号 是 要 求 

shell 执 行 其 包含 的 命令 并 将 输出 结果 附加 其 后 。 

当 使 用 以 下 命令 来 运行 这 个 程序 时 ， 你 的 窗口 将 会 弹出 〈 见 图 16-4) : 

$ ./gtk1 

注意 ， 你 可 以 对 这 个 窗口 进行 移动 、 调 整 大 小 、 最 小 化 和 最 大 化 。 

你 用 一 条 语句 tinclude <gtk/gtk.h> 来 包含 必需 的 GTK+ 库 和 相关 库 图 16-4 
(包括 Glib) 的 头 文件 。 接 着 ， 你 声明 窗口 为 一 个 指向 Gtkwidget 的 指针 。 

为 了 初始 化 GTK+ 库 ， 你 必须 调用 gtk_init 函 数 ， 将 命令 行 参 数 argc 和 argv 传 递 给 它 。 这 给 了 
GTK+ 一 个 机 会 来 解析 它 需 要 知道 的 任何 命令 行 参数 。 注意 : 你 必须 在 调用 任何 GTK+ 函 数 之 前 对 其 进 
行 这 样 的 初始 化 。 

这 个 例子 的 核心 代码 是 对 gtk_window_new 的 调用 ， 其 函数 原型 是 : 

GtkWidget* gtk window new (GtkWindowType type); 

参数 type 根 据 窗口 的 目的 可 取 下 面 两 个 值 之 一 。 

C GTK_WINDOW_TOPLEVEL: 一 个 标准 的 有 框架 窗口 。 

口 GTK_WINDOW_POPUP: 一 个 适用 于 对 话 框 的 无 框架 窗口 。 

你 几乎 总 是 使 用 GTK_wINDOW_TOPLEVEL， 因 为 你 将 在 后 面 看 到 , 还 有 更 方便 的 创建 对 话 框 的 方法 。 

gtk_window_new 调 用 在 内 存 中 建立 窗口 ， 使 得 在 将 窗口 实际 显示 在 屏幕 之 前 ， 你 可 以 在 它 里 面 
放置 构件 ， 调 整 它 的 大 小 ， 改 变 窗口 的 标题 等 。 要 实际 显示 窗口 ， 你 需要 调用 gtk_widget_show: 
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gtk widget show(window); 

该 函数 只 需要 一 个 Gtxwidoet 指 针 ， 因 此 你 只 需 把 窗口 的 引用 传 给 它 即 可 。 

你 最 后 调用 的 函数 是 otx_main。 这 个 关键 函数 通过 把 控制 权 交 给 GTK+ 来 启动 交互 过 程 ， 并 且 
直 运 行 , 直到 调用 gtk_main_quit 才 返回 。 正如 你 所 看 到 的 , gtk1.c 并 未 调用 gtk_main_gquit, 因此 ， 
即使 窗口 被 关闭 ， 程 序 也 不 会 停止 。 你 可 以 试 着 点 击 关闭 图 标 ， 你 将 看 到 并 没有 返回 命令 提示 符 。 我 
们 将 在 下 一 节 学 过 信号 和 回调 函数 之 后 青 来 纠正 这 个 错误 。 至 于 现在 ， 你 可 以 在 启动 gtkl 程 序 的 shell 
窗口 中 按 下 Ctrl+C 组 合 键 来 退出 这 个 程序 。 


16.3 事件、 信号 和 回调 函数 


所 有 的 GUI 库 都 有 一 个 共同 点 : 必须 存在 某 种 机 制 来 响应 用 户 动作 并 执行 相应 代码 。 一 个 命令 行 
程序 的 奢侈 做 法 是 暂停 执行 ,等 待 用 户 输入 ,然后 采用 switch 语 句 等 方法 让 程序 根据 输入 进行 分 支 执 
行 。 但 这 种 方法 并 不 适用 于 GUI 应 用 程序 ， 因 为 应 用 程序 必须 不 断 响应 用 户 输 入 ， 例 如 ， 它 需要 不 断 
更 新 窗口 区 域 。 

现代 窗口 系统 用 事件 和 事件 监听 器 系统 来 解决 这 个 问题 。 其 思想 是 ， 每 次 用 户 输入 〈 通 常 是 通过 
鼠标 或 是 键盘 ) 都 触发 一 个 事件 。 例 如 ， 一 次 击 键 会 触发 一 个 键盘 事件 。 因 此 ， 程 序 员 需 要 编写 监听 
这 些 事件 的 代码 ， 以 及 当 事 件 被 触发 时 要 执行 的 代码 。 

正如 你 前 面 所 看 到 的 ，X 视 窗 系统 会 些 事件 , 但 是 它们 对 GTK+ 程 序 员 并 没有 太 大 帮助 ， 因 
为 它们 都 是 非常 底层 的 。 当 鼠标 按钮 被 点 击 发 出 一 个 包含 鼠标 指针 坐标 的 事件 ， 而 你 真正 需要 
知道 的 是 用 户 何 时 激活 了 一 个 构件 。 

因此 ，GTK+ 有 它 自己 的 事件 和 事件 监听 器 系统 ， 它 们 被 称 为 信号 和 回调 函数 。 它 们 非常 容易 使 
用 ， 因 为 你 可 以 使 用 C 语 言 的 一 个 非常 有 用 的 特征 一 一 函数 指针 来 设置 信号 处 理 器 。 

先 看 一 些 定义 : GTK+ 信 号 是 当 某 件 事 〈 如 用 户 输入 ) 发 生 时 ， 由 Gtkobject 对 象 发 出 的 。 一 个 
与 信号 相连 接 ， 并 且 一 旦 当 信号 被 发 出 ， 它 就 会 被 调用 的 函数 被 称 为 回调 函数 。 

注意 ，GTK+ 信 号 与 第 11 章 中 讨论 的 UNIX 信 号 无 关 。 

作为 一 个 GTK+ 程 序 员 ， 你 需要 关心 的 就 是 ， 如 何 编写 和 连接 回调 函数 ， 因 为 发 出 信号 的 代码 是 
内 办 在 特定 构件 中 的 。 

回调 函数 的 原型 通常 如 下 所 示 : 

void a callback function ( GtkWidget *widget, gpointer user data); 

其 中 传递 了 两 个 参数 ;第 一 个 参数 是 指向 发 出 信号 的 构件 的 指针 ， 第 二 个 参数 是 当 你 连接 回调 函 
数 时 自己 选择 的 一 个 任意 指针 。 你 可 将 该 指针 用 于 任何 目的 。 

连接 回调 函数 同样 简单 。 你 只 需 调 用 g_signal_connect， 并 传递 如 下 几 个 参数 ， 构件、 信号 名 
(作为 字符 串 ) 、 回 调 函 数 指针 和 你 的 任意 指针 : 


gulong g signal connect(gpointer *object, const gchar *name, GCallback func, 
gpointer user data ); 


有 一 点 值得 指出 连接 回调 函数 没有 任何 限制 。 你 可 以 将 多 个 信号 连接 到 同一 个 回调 函数 ， 也 可 
以 将 多 个 回调 函数 连接 到 同一 个 信号 。 有 关 每 个 构件 发 出 的 信号 的 详细 资料 请 参阅 GTK+ API 文 档 。 


在 GTK+2 之 前 的 版 本 中 ， 用 于 连接 回调 函数 的 函数 是 gtk_signal_connect， 该 函数 
已 被 9_signal_connect 取 代 ， 你 在 新 的 代码 中 不 应 再 使 用 该 函数 . 
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在 下 一 个 例子 中 ， 我 们 将 使 用 函数 g_signal_connect。 





回调 函数 


在 gtk2.c 中 ， 你 将 在 窗口 中 添加 一 个 按钮 ， 并 将 这 个 按钮 的 "clicked* 信 号 与 回调 函数 连接 ， 从 
而 显示 一 条 短信 息 : 


Winclude «gtk/gtk.h» 
#include <stdio.h> 


static int count = 0; 


void button clicked(GtkWidget *button, gpointer data) 
í 
printf('&s pressed %d time(s) \n", (char *) data, ++count); 


int main (int argc, char *argv[]) 
t 

GtkWidget *window; 

GtkWidget *button; 


gtk init(&argc, &argv); 

window = gtk window new(GTK WINDOW TOPLEVEL) ; 
button = gtk button new with label(*Hello World!*); 
gtk container add(GTK CONTAINER (window), button); 


G.signal connect(GTK OBJECT (button), "clicked", 
GTK SIGNAL FUNC (button. clicked), 
"Button 1*); 

gtk. widget. show (button) ; 

gtk widget show(window); 








gtkmain (; 
return 0; 
) 
输入 这 个 程序 的 源 代码 并 将 它 保存 为 
gtk2.c。 使 用 gtk1.c 示 例 类 似 的 命令 编 





译 和 链接 这 个 程序 。 当 运行 这 个 程序 时 ， 你 将 看 
到 一 个 带 按钮 的 窗口 ， 每 次 当 你 点 击 这 个 按钮 时 ， 
它 都 会 输出 一 条 短 消息 ( 见 图 16-5)。 


gtk2.c 的 代码 中 引入 了 两 个 新 特性 : 
GtkButton 和 回调 函数 。GtkButton 是 一 个 简单 
的 按钮 构件 ， 它 可 以 包含 文本 〔 在 本 例 中 ， 它 包含 
的 文本 是 “Hello World”)， 并 在 鼠标 点 击 这 个 按钮 
时 发 出 被 称 为 "clickea" 的 信号 。 








图 16-5 
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回调 函数 putton_clicked 通 过 g_signal_connect 函 数 连接 到 按钮 构件 的 "clickea" 信 号 : 
g.signal connect(GTK OBJECT (app), "clicked", 

GTK SIGNAL FUNC (button clicked), 

"Button 1"); 


注意 ， 按 钮 的 名 称 Button 1 作为 用 户 数据 传递 给 回调 函数 。 

代码 的 其 他 部 分 处 理 按钮 构件 ， 它 的 创建 方法 与 窗口 类 似 ， 调 用 gtk_button_new_with | label 
函数 ， 然 后 用 gtk_widget_show 使 其 可 见 。 

通过 调用 gtk_container_ada 函 数 将 按钮 放置 到 窗口 上 。 这 个 简单 的 函数 将 一 个 Gtkwiaget 放 到 
-个 Gtkcontainer 中 ， 并 以 容器 和 构件 作为 参数 : 

void gtk_container_add (GtkContainer *container, GtkWidget *widget); 


正如 你 之 前 看 到 的 ，Gtkwindow 是 Gtkcontainer 的 一 个 子 类 ， 因 此 你 可 以 通过 GkT_CONTAINER 宏 
将 窗口 对 象 转换 为 Gtkcontainer 类 型 


gtk_container_add (GTK_CONTAINER (window), button); 


通过 gtk_container_aGa 向 一 个 容器 里 放置 一 个 构件 是 很 方便 的 , 但 更 多 的 情况 是 ， 你 需要 在 一 
个 窗口 的 不 同位 置 放置 好 几 个 构件 以 创建 一 个 像样 的 外 观 。 GTK+ 有 专用 于 此 目的 的 构件 一 一 金 (box) 
或 者 容器 Container) 。 


16.4 组 装 盒 构 件 


GUI 的 布局 对 其 可 用 性 来 说 至 关 重 要 ,同样 也 是 最 难 做 好 的 事情 之 一 。 排列 构件 的 真正 困难 在 于 ， 
你 不 能 指望 所 有 用 户 都 有 相同 的 屏幕 分 辨 率 ， 或 有 相同 的 窗口 大 小 、 主 题 、 字 体 、 颜 色 方案 。 在 一 个 
系统 中 令 人 满意 的 界面 在 另 一 个 系统 中 却 可 能 无 法 显示 。 

为 创建 一 个 在 所 有 系统 中 都 保持 一 致 的 GUI， 你 要 避免 使 用 绝对 坐标 来 放置 构件 ， 而 是 采用 一 种 
更 灵活 的 布局 系统 。GTK+ 通 过 容器 构件 来 实现 这 一 目标 。 它 可 以 用 来 在 应 用 程序 窗口 中 控制 构件 的 
布局 。 盒 构件 是 一 个 非常 有 用 的 容器 构件 类 型 .GTK+ 还 提供 了 许多 其 他 类 型 的 容器 构件 , 它们 在 GTK+ 
的 在 线 文档 中 都 有 介绍 。 

念 是 一 个 不 可 见 的 构件 ， 它 的 工作 就 是 包含 其 他 的 构件 ， 并 控制 它们 的 布局 。 为 了 控制 盒 中 每 个 
i WAKA, WAER ERREK. ERAH AEAEE GtkWidget, ifictkBoxAk f) it 
PRET LAHK FE fc Ka PER OI de a Ze RAE J 
个 主要 的 子 类 。 

O sckHBox 是 一 个 单行 的 横向 组 装 盒 构件 。 
口 GtkVBox 是 一 个 单列 的 纵向 组 装 盒 构件 。 
在 创建 组 装 盒 时 ， 你 需要 指定 两 个 参数 homogeneous 和 spacing) : 


GtkWidget* gtk hbox new (gboolean homogeneous, gint spacing); 
GtkWidget* gtk_vbox new (gboolean homogeneous, gint spacing); 


这 些 参数 控制 特定 组 装 盒 中 所 有 构件 的 布局 。homogeneous 是 一 个 布尔 值 ， 如 果 它 被 设 为 TRUE， 
则 强制 盒 中 的 每 个 构件 都 占据 相同 大 小 的 空间 ， 而 不 管 每 个 构件 的 大 小 。spacing 以 像素 为 单位 设置 
构件 间 的 间距 。 

一 旦 创建 好 组 装 盒 之 后 , 你 就 可 以 用 gtk_box_pack_start 和 gtk_box_pack_end 函 数 来 添加 构件 
T: 
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void gtk box pack start (GtkBox *box, GtkWidget *child, 
gboolean expand, gboolean fill, 
guint padding); 


void gtk box pack end (GtkBox *box, GtkWidget *child, 
gboolean expand, gboolean fill, 
guint padding); 
gtk_box_pack_start 向 GtkHbox 的 右边 和 GtkVbox 的 底部 增加 构件 ， 而 gtk_box_pack_end 则 向 
GtkHbox 的 左边 和 Gtkvbox 的 顶部 增加 构件 。 它 们 的 参数 控制 组 装 盒 中 每 个 构件 的 间距 和 格式 ， 
表 16-1 描 述 了 可 以 传递 给 gtk_box_pack_start 或 gtk_box_pack_end 的 参数 。 








表 16-1 
5 m" 说 m 
GtkBox "box 将 被 填充 的 组 装 僵 
Gtkwidget *child 要 放 入 组 装 愈 的 构件 
gboolean expand 如 果 为 TRUE， 则 这 个 构件 将 填充 与 其 他 该 标志 也 被 设 为 TRUE 的 构件 共享 的 所 有 可 用 空间 
gboolean fill 如 果 为 TRUE， 则 这 个 构件 将 填 满分 配给 它 的 空间 ， 而 不 是 将 它 作为 围绕 它 的 边缘 填充 。 
这 个 参数 只 有 在 expana 为 TRUE 时 才 有 效 
guint padding 围绕 在 构件 周围 的 以 像素 为 单位 的 填充 


现在 让 我 们 来 看 看 这 些 组 装 盒 构件 ， 并 创建 一 个 更 复杂 的 用 户 界面 来 展示 组 装 盒 的 民 套 使 用 。 


实验 构件 容器 的 布局 


在 本 例 中 ， 我 们 使 用 GtkHbox 和 GtkvBox 来 排列 一 些 简单 的 GtkLabel 构 件 。 标 签 是 一 种 简单 的 构 
件 ， 它 用 于 显示 少量 的 文本 。 这 个 程序 名 为 container.c。 
finclude «gtk/gtk.h» 


void closeApp ( GtkWidget *window, gpointer data) 
i gtk_main_quit(); 
$ 
/* Callback allows the application to cancel 
a close/destroy event. (Return TRUE to cancel.) */ 
gboolean delete event(GtkWidget *widget, GdkEvent *event, gpointer data) 
t 
printf ("In delete_event\n"); 
return FALSE; 
) 


int main (int argc, char *argv(]) 


t 
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GtkWidget *window; 

GtkWidget *labell, *label2, *label3; 
GtkWidget *hbox; 

GtkWidget *vbox; 


gtk init(kargc, &argv); 
window = gtk window new(GTK WINDOW TOPLEVEL); 


gtk window set title(GTK WINDOW!window), “The Window Title"); 


gtk window set. position(GTK WINDOW(window), GTK WIN POS CENTER); 
gtk window set, default. size(GTK. WINDOW(window), 300, 200); 


g.signal connect ( GTK OBJECT (window), "destroy", 
GTK SIGNAL FUNC ( closeApp), NULL); 
g.signal connect ( GTK OBJECT (window), 'delete event*, 


GTK SIGNAL FUNC ( delete event), NULL); 





labeli = gtk label new(*Label 1"); 
label2 = gtk label new(*Label 2"); 
label3 = gtk label new('Label 3*); 


hbox = gtk hbox new ( TRUE, 5 ); 
vbox  gtk vbox new ( FALSE, 10); 


gtk box pack start(GTK BOX(vbox), labell, TRUE, FALSE, 5); 
gtk box pack start(GTK BOX(vbox), label2, TRUE, FALSE, 5); 


gtk box pack start(GTK BOX(hbox), vbox, FALSE, FALSE, 5); 
gtk box pack start(GTK BOX(hbox), label3, FALSE, FALSE, 5); 


gtk container add(GTK CONTAINER(window), hbox); 
gtk. widget. show, a11 (window); 
gtk main (); 


return 0; 
) 


运行 这 个 程序 ， 你 将 在 窗口 中 看 到 标签 构件 的 布局 〈 见 图 16-6)。 


The Window Title 
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上 述 创 建 了 两 个 组 装 盒 构 件 :hbox 和 vibox。 我 们 用 gtk_box_pack_start 在 vbox 中 添加 了 labell 
和 1abe12, 因为 labe12 是 在 labe11 之 后 添加 的 , 所 以 labe12 出 现在 底部 。 接 下 来 , vbox 本 身 和 1labe13 
一 起 被 添加 到 hbox 中 。 

hbox 最 后 被 添加 到 窗口 中 ， 并 使 用 gtk_wiagec_show_al1 显 示 在 屏幕 上 。 

理解 组 装 盒 布局 的 最 好 方式 是 通过 图 示 《〈 见 图 16-7)。 
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图 16-7 
Bite cue 了 构件 }、 回 调 函 数 和 容器 构件 ， 这 些 都 是 GTK+ 最 本 质 的 内 容 。 但 要 成 为 
-个 优秀 的 GTK+ 程 序 员 ， 要 了 解 如 何 充分 利用 好 它 所 提供 的 各 种 构件 。 


16.5 GTK+ 构 件 

在 本 节 中 ， 我 们 将 介绍 应 用 程序 中 最 常用 的 一 些 GTK+ 构 件 的 API。 
16.5.1 GtkWindow 

GtkwinGow 是 所 有 GTK+ 应 用 程序 的 基本 元 素 。 我 们 用 它 来 持 有 构件 : 


GtkWidget 
+----GtkContainer 
*----GtkBin 
*----GtkWindow 
有 许多 的 Gtkwindow API 调 用 ， 下 面 这 些 是 值得 特别 关注 的 : 
GtkWidget* gtk window new (GtkWindowType typel; 
void gtk window set title (GtkWindow *window, const gchar *title); 
void gtk window set position (GtkWindow *window, GtkWindowPosition position); 
void gtk window default size (GtkWindow *window, gint width, gint height); 
void gtk window ze (GtkWindow *window, gint width, gint height); 
void gtk window -esizable (GtkWindow *window, gboolean resizable); 
void gtk window present (GtkWindow *window); 
void gtk window maximize (GtkWindow *window); 
void gtk window unmaximize (GtkWindow *window); 


正如 你 刚才 所 看 到 的 ，gtk_window_new 在 内 存 中 创建 了 一 个 新 的 空白 窗口 。 窗 口 的 标题 没有 设 
置 ， 窗 口 的 大 小 和 屏幕 位 置 都 没有 定义 。 你 通常 会 将 各 种 构件 填 入 其 中 ， 并 设置 一 个 菜单 和 工具 栏 ， 
然后 才 调 用 gtk_widget_show 在 屏幕 上 显示 它 。 
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9tk_window_set_title 函 数 通 过 向 窗口 管理 器 发 出 请 求 来 改变 标题 栏 文本 。 
注意 : 因为 是 窗口 管理 器 而 不 是 GTK+ 负 责 绘制 窗口 周边 ， 所 以 文字 字体 、 颜 色 和 大 小 
都 取决 于 你 所 选 的 窗口 管理 器 . 
gtk_window_set_position 控 制 窗口 在 屏幕 上 的 初始 位 置 。 参 数 position 有 5 个 取 值 ， 如 表 16-2 
所 示 。 








表 16-2 
位 置 参数 LEN] 
GTK WIN POS NONE 窗口 位 置 由 窗口 管理 器 决定 
GTK WIN POS CENTER 窗口 放 在 屏幕 中 央 
GTK WIN POS MOUSE 窗口 放 在 鼠标 指针 位 置 
GTK_WIN_POS_CENTER_ALWAYS 不 论 窗口 大 小 ， 始 终 保持 窗口 在 屏幕 中 央 
GTK_WIN_POS_CENTER_ON_PARENT 将 窗口 放 在 父 窗口 中 央 〔 对 对 话 框 有 用 ) 





gtk_window_set_default_size 按 GTK+ 绘 图 单元 设置 屏幕 中 窗口 的 大 小 。 明 确 设置 屏幕 大 
小 可 以 避免 窗口 内 容 不 清楚 或 被 隐藏 。 一 旦 窗口 在 屏幕 上 显示 ,你 可 以 通过 gtk_window_resize 来 强 
制 调整 窗口 大 小 。 默 认 情况 下 ， 用 户 可 以 以 通常 的 方法 通过 拖 旧 窗口 边框 来 改变 其 大 小 。 要 阻止 用 户 
这 么 做 ， 你 可 以 调用 gtk_window_set_resizable 函 数 ， 将 参数 resizable 设 为 FALSE。 

为 了 确保 窗口 在 屏幕 上 并 且 对 用 户 是 可 见 的 ， 即 它 没有 被 最 小 化 或 隐藏 ， 你 可 以 使 用 gtk_winaow 
_present 来 完成 这 个 任务 。gtk_window_present 对 于 对 话 框 来 说 很 有 用 ， 它 可 以 确保 在 你 需要 用 户 
输入 时 它们 没有 被 最 小 化 。 另 外 ， 要 强制 最 大 化 和 最 小 化 窗口 ， 你 可 以 使 用 gtk_window_ maximize 
和 gtk_window_minimize 函 数 。 


16.5.2 GtkEntry 


GtkBntry 是 一 个 单行 文本 输入 构件 , 它 常用 于 输入 简单 的 文本 信息 ,例如 电子 邮件 地 址 、 用 户 名 
或 主机 名 。 你 可 以 通过 相应 的 API 调 用 来 设置 和 读 取 输 入 的 文本 ， 设 置 允许 的 最 大 字符 数 ， 以 及 设置 
其 他 一 些 属性 来 控 制 文本 的 定位 和 选择 : 

GtkWidget 

*----GtkEntry 

GtkEBntry 可 被 设置 为 使 用 星 号 (或 者 任何 其 他 用 户 定义 的 字符 ) 来 代替 输入 的 字符 , 这 在 输入 密 
码 时 很 有 用 ， 因 为 你 不 希望 别人 在 旁边 看 到 你 输入 的 文本 。 

下 面 我 们 将 描述 最 有 用 的 一 些 GtkEnt ry 函数 : 

GtkWidget* gtk entry new (void); 

GtkWidget* gtl itry new with max length (gint max); 

void gtk entry set max length (GtkEntry *entry, gint max); 

G CONST RETURN gchar* gtk entry get text (GtkEntry *entry); 

void gtk entry set text (GtkEntry *entry, const gchar *text); 

void gtk entry append text (GtkEntry *entry, const gchar *text); 

void gtk entry prepend text (GtkEntry *entry, const gchar *text); 

void gtk entry set visibility (GtkEntry *entry, gboolean visible); 

void gtk entry : | invisible char (GtkEntry *entry, gchar invch); 

void gtk entry set editable (GtkEntry *entry, gboolean editable); 


你 可 以 通过 gtk_entry_new 或 固定 最 大 文本 输入 长 度 的 gtk_entry_new_with_max_length 来 创 
建 一 个 GtkEntry。 限 制 输入 不 超过 某 一 长 度 将 省 去 你 检查 输入 长 度 ， 并 通知 用 户 文本 输入 过 长 的 负担 。 
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要 获取 GtkEntry 的 内 容 ,你 可 以 调用 gtk_entry_get_rext 函 数 , 它 将 返回 GrkEntry 内 部 的 一 个 


const char 指 针 


《G_CONST_RETURN 是 一 个 GLib 定 义 的 宏 )。 如 果 你 想 修改 这 个 文本 或 把 它 传 给 一 个 


可 能 修改 它 的 函数 ， 就 必须 使 用 像 scrcpy 这 样 的 函数 来 复制 这 个 字符 串 。 

你 可 以 通过 _set_text、_append_text、_modift_text 函 数 来 手工 设置 或 修改 GtkEntry 的 内 容 。 
注意 这 些 函 数 都 使 用 const 指 针 作为 参数 。 

如 果 想 将 GtkEntry 作 为 一 个 密码 输入 框 使 用 ， 在 显示 字符 的 地 方 用 星 号 来 代替 ， 你 可 以 用 
gtk_entry_set_visibility 函 数 , 并 将 它 的 参数 visible 设 为 FALSE。 不 可 见 字符 的 替代 符号 可 以 根 
据 需 要 使 用 gtk_entry_set_invisible_char 函 数 来 改变 。 


EE 用 户 名 和 密码 输入 框 


你 已 经 了 解 了 GtkEntry 函 数 ,现在 通过 一 个 小 程序 来 实际 演示 它们 。ent ry .c 将 创建 一 个 用 户 名 


和 密码 输入 窗口 ， 


然后 将 输入 的 密码 与 一 个 内 置 的 密码 相 比较 。 


(1) 首先 定义 这 个 内 置 的 密码 ， 就 选 为 secret 吧 : 


#include <gtk/gtk.h> 
#include <stdio.h> 
#include <string.h> 


const char * password = "secret"; 
(2) 下 面 是 两 个 回调 函数 ， 分 别 在 关闭 窗口 和 点 击 OK 按钮 时 调用 : 
void closeApp ( GtkWidget *window, gpointer data) 


t 


gtk main quit(); 


void button clicked (GtkWidget *button, gpointer data) 


{ 


const char *password text = gtk_entry_get_text (GTK_ENTRY ( (GtkWidget *) data)); 


if (strcmp(password text, password) == 0) 
printf ("Access granted!Wn*); 


else 


printf ("Access denied!\n"); 


(3) 在 main 函 数 中 ， 创 建 和 排列 界面 ， 并 且 连 接 好 回调 函数 。 我 们 用 hbox 和 vbox 容 器 构件 来 放置 
标签 和 输入 框 构件 。 


int main (int argc, char *argv[]) 


t 
GtkWidget 
GtkWidget 
GtkWidget 
GtkWidget 
GtkWidget 
GtkWidget 


*window; 

*username label, *password label; 
*username entry, *password entry; 
*ok button; 

*hboxl, *hbox2; 

*vbox; 


gtk init(&argc, &argv); 
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window = gtk window new(GTK WINDOW. TOPLEVEL); 

gtk window set title(GTK WINDOW(window), "GtkEntryBox*); 

gtk window set position(GTK WINDOW(window), GTK WIN POS CENTER); 
gtk window set default size(GTK WINDOW(window), 200, 200); 


g.signal connect ( GTK OBJECT (window), "destroy", 
GTK SIGNAL FUNC ( closeApp), NULL); 


username label = gtk label new(*Login:"); 
password label = gtk label new("Password. 





username entry = gtk entry new(); 
password entry = gtk entry new(]; 
gtk entry set visibility(GTK ENTRY (password entry), FALSE); 


ok button = gtk button new with label(*Ok"); 


g-signal connect (GTK OBJECT (ok button), "clicked", 
GTK SIGNAL FUNC(button clicked), password entry]; 


hboxi 
hbox2 


gtk hbox new ( TRUE, 5 ); 
gtk hbox new ( TRUE, 5 ); 


vbox = gtk vbox new ( FALSE, 10); 


gtk box pack start(GTK BOX(hboxi), username label, TRUE, FALSE, 5); 
gtk box pack start(GTK BOX(hboxl), username entry, TRUE, FALSE, 5); 


gtk box pack start(GTK BOX(hbox2), password label, TRUE, FALSE, 5); 
gtk box pack start(GTK BOX(hbox2), password entry, TRUE, FALSE, 5); 


gtk box pack start(GTK BOX(vbox), hboxl, FALSE, FALSE, 5); 
gtk box pack start(GTK BOX(vbox), hbox2, FALSE, FALSE, 5 
gtk box pack start(GTK BOX(vbox), ok button, FALSE, FALSE, 5); 





gtk.container add(GTK CONTAINER(window), vbox); 


gtk widget. show, a11 (window); 
gtk main (); 


return 0; 


) 
运行 这 个 程序 ， 你 会 看 到 如 图 16-8 所 示 的 窗口 。 

这 个 程序 创建 了 两 个 GtkEntry 构 件 (username_entry 和 password_entry) ， 并 将 passwora_ 
entry 的 可 见 性 设 为 FALSE 来 隐藏 输入 的 密码 。 然 后 它 创 建 了 一 个 GtkButton， 并 将 它 的 "clickea" 
号 连接 到 button_clicked 回 调 函 数 。 

在 回调 函数 中 ， 程 序 将 获取 输入 的 密码 ， 并 将 它 与 内 置 的 密码 做 比较 ， 然 后 显示 适当 的 信息 。 

注意 ,我 们 多 次 使 用 gtk_box_pack_start 语 句 来 向 容器 中 增加 构件 . 为 了 减少 这 些 重复 的 代码 ， 
你 将 在 后 面 的 例子 中 定义 一 个 辅助 函数 。 
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图 16-8 
16.5.3 GtkSpinButton 

有 时 候 ， 你 需要 用 户 输入 一 个 数字 类 型 的 值 ， 例 如 一 个 设备 的 最 大 速度 或 长 度 。 在 这 种 情况 下 ， 
使 用 GtkspinButton 是 最 理想 的 。 GtkspinButton 限 制 用 户 只 能 输入 数字 字符 ,你 可 以 为 输入 值 设 置 
上 界 和 下 界 。 这 个 构件 还 提供 向 上 和 向 下 的 箭头 ， 用 户 仅 用 鼠标 就 可 以 很 方便 地 选择 数值 。 

GtkWidget 

*----GtkEntry 
*----GtkSpinButton 

相应 的 API 函 数 都 很 简单 明了 ， 下 面 我 们 列 出 最 常用 的 函数 : 

GtkWidget* gtk spin button new (GtkAdjustment *adjustment, gdouble climb rate, 

guint digits); 

GtkWidget* gtk spin button new with range (gdouble min, gdouble max, gdouble step); 

void gtk spin button set digits (GtkSpinButton *spin button, guint digits); 

void gtk spin button set increments (GtkSpinButton *spin button, gdouble step, 

gdouble page); 

void gtk spin button set range (GtkSpinButton *spin button, gdouble min, 

gdouble max); 

gdouble gtk spin button (GtkSpinButton *spin button); 

gint gtk spin button get 、 s int (GtkSpinButton *spin button); 

void gtk spin button set value (GtkSpinButton *spin button, gdouble value); 

要 使 用 gtk_spin_button_new 来 创建 一 个 GtkspinButton， 你 首先 需要 创建 一 个 GtkAGjust- 
ment 对 象 。GtkAdjustment 是 一 个 抽象 对 象 ， 它 包含 控制 有 界 数值 的 逻辑 。GtkAadjustment 也 在 其 他 
构件 中 使 用 ， 如 ctkHscale 和 Gtkvscale。 

要 创建 Gtkadjustment， 你 需要 给 它 传递 一 个 初始 值 、 上 界 、 下 界 和 递增 量 : 


GtkObject* gtk adjustment new (gdouble value, gdouble lower, gdouble upper, 
gdouble step increment, gdouble page increment, 
gdouble page size); 


step_increment 和 page_increment 的 值 分 别 设置 最 小 和 最 大 递增 最 。 在 使 用 GtkspinButton 的 
情况 下 ，step_increment 设置 点 击 箭头 时 值 变化 的 量 。page_incremenc 和 page_size 对 于 
GtkSpinButton 来 说 不 重要 。 

gtk_spin_button_new 的 第 二 个 参数 climb_rate 用 于 控制 当 你 持续 按 着 箭头 按钮 时 数值 变化 的 
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快慢 。 最 后 ， 参 数 Gigits 设 置 构件 的 精度 。 因 此 ， 当 Gigit 值 为 3 时 ，spin 按 钮 将 显示 0.00。 
9tk_spin_putton_new_with_range 可 以 很 方便 地 在 创建 GtkspinButton 的 同时 创建 一 个 
GtkAdjustment， 你 只 需 传递 给 它 上 下 界 和 递增 量 即 可 。 
使 用 gtk_spin_button_get_value 可 以 很 容易 地 读 取 到 当前 值 。 如 果 希 望 获得 一 个 整数 值 ， 你 
可 以 使 用 gtk_spin_button_get_value_as_int。 











GtkSpinButton 


你 将 通过 一 个 小 例子 看 到 GtkspinButton 的 实际 使 用 情况 。 这 个 程序 名 为 spin.c。 
#include <gtk/gtk.h> 


void closeApp ( GtkWidget *window, gpointer data) 
t 

gtk main quit(); 
) 


int main (int argc, char *argv[]) 
t 
GtkWidget *window; 
GtkWidget *spinbutton; 
Gtkobject *adjustment; 


gtk init (&argc, &argv); 
window = gtk window new(GTK WINDOW. TOPLEVEL); 
gtk window set default size ( GTK WINDOW(window), 300, 200); 
g.signal connect ( GTK OBJECT (window), "destroy", 
GTK SIGNAL FUNC ( closeApp), NULL); 


adjustment = gtk adjustment new(100.0, 50.0, 150.0, 0.5, 0.05, 0.05); 
spinbutton = gtk spin button new(GTK ADJUSTMENT(adjustment), 0.01, 2); 


gtk container add(GTK CONTAINER(window), spinbutton); 
gtk. widget show all(window); 
gtk main (); 


return 0; 
) 


运行 这 个 程序 ， 你 会 得 到 一 个 数值 在 50 一 100 之 间 的 微调 (spin) 按钮 ( 见 图 16-9)。 
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16.5.4 GtkButton 


你 已 在 程序 中 看 过 GtkButton 的 使 用 情况 ， 但 是 从 GtkButton 还 派生 出 很 多 按钮 构件 ， 它 们 有 着 
更 丰富 的 功能 ， 非 常 值得 一 提 : 

GtkButton 

*----GtkToggleButton 
*----GtkCheckButton 

-GtkRadioButton 

从 上 面 的 构件 层次 图 中 可 以 看 到 ，GtkToggleButton 直 接 继承 自 GtkButton，GtkCheckButton, 
继承 自 ctkToggleButton，GtkRadioButton 继 承 自 GCtkcheckButton。 每 个 子 构件 都 有 其 专门 
用 处 。 

1. GtkToggleButton 

GtkToggleButton 和 GtkButton 几 乎 完全 一 样 ， 但 它们 之 间 有 一 个 重要 区 别 ， 前 者 拥有 状 
就 是 说 , 它 可 以 打开 或 关闭 。 当 用 户 点 击 GtkToggleButton 时 ， 它 按 通 常 的 方式 发 出 "clickea" 
并 改变 (或 切换 ) 其 状态 。 

GtkToggleButton 的 API 函 数 非常 简单 明了 : 

GtkWidget* gtk toggle button new (void); 

GtkWidget* gtk toggle button new with label (const gchar *label); 

gboolean gtk toggle button get active (GtkToggleButton *toggle button); 

void gtk toggle button set active (GtkToggleButton *toggle button, 

gboolean is active); 












两 个 值得 关注 的 函数 是 gtk_toggle_button_get_active 和 gtk_toggle_button_set_active, 
你 调用 它们 来 读 取 和 设置 开关 按钮 的 状态 。 一 个 TRUE 返 回 值 表明 GtkToggleButton 处 于 “ 开 ” 状 态 。 

2. GtkCheckButton 

GtkCheckButton 是 一 个 变相 的 GtkToggleButton。 它 不 像 GtkToggleButton 那 样 显示 一 个 令 人 
厌烦 的 矩形 方块 ， 而 是 显示 一 个 旁边 带 有 文本 的 复 选 框 ， 这 看 起 来 颇 令 人 兴奋 ， 但 两 者 之 间 并 没有 功 
能 上 的 差异 。 

GtkWidget* gtk check button new (void); 

GtkWidget* gtk check button new with label (const gchar *label); 

3. GtkRadioButton 

这 个 按钮 与 前 面 的 有 很 大 不 同 ， 因 为 它 可 以 与 同类 型 的 其 他 按钮 分 为 一 组 。GtkRadioButton 是 
这 样 一 种 按钮 ， 它 允许 你 一 次 只 能 从 一 组 选项 中 选择 一 个 。 它 的 名 字 来 源 于 老式 的 收音 机 一 一 它们 有 
许多 机 械 按 键 ， 当 你 按 下 一 个 按键 时 ， 其 他 的 按键 都 将 弹 起 来 。 

GtkWidget* gtk radio button new (GSList *group); 

GtkWidget* gtk radio button new from widget (GtkRadioButton *group); 

GtkWidget* gtk radio button new with label (GSList *group, const gchar *1abel); 

void gtk radio button set group (GtkRadioButton *radio button, GSList *group); 

GSList* gtk radio button get group (GtkRadioButton *radio button); 

RadioButton CHE TZ EL) 组 由 一 个 Glib 的 列表 对 和 象 GsList 表 示 。 为 了 将 单 选 按钮 放 在 一 个 组 里 ， 
你 可 以 创 键 一 个 Gslist， 并 通过 gtk_radio_button_new 和 gtk_radio_button_get_group 来 将 它 传 
递 给 每 一 个 按钮 。 不 过 ， 还 有 一 个 更 简单 的 方法 ， 通 过 gtk_radio_button_new_from_widget 可 以 
从 一 个 现 有 的 按钮 中 获取 GsList。 你 将 在 下 一 个 例子 中 看 到 它 的 使 用 方法 。 在 下 面 的 例子 中 , 我 们 将 
使 用 不 同 的 GtkButton。 
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GtkCheckButton、GtkToggleButton 和 GtkRadioButton 


输入 下 面 这 个 程序 ， 并 把 它 命名 为 buttons.c。 
(1) 首先 将 按钮 指针 声明 为 全 局 变量 : 


#include «gtk/gtk.h» 
#include <stdio.h> 


GtkWidget *togglebutton; 
GtkWidget *checkbutton; 
GtkWidget *radiobuttonl, *radiobutton2; 


void closeApp ( GtkWidget *window, gpointer data) 
{ 
gtk main quit(); 
) 
(2) 这 里 我 们 定义 了 一 个 辅助 函数 , 它 将 Gtkwiaget 和 GtkLabel 放 入 一 个 GtkHbox 中 ,然后 将 这 个 
GtkHbox 添 加 到 一 个 指定 的 容器 构件 中 。 这 样 做 有 助 于 减少 重复 的 代码 。 


void add widget with label(GtkContainer * box, gchar * caption, GtkWidget * widget) 
t 


GtkWidget *label = gtk label new (caption); 
GtkWidget *hbox = gtk hbox new (TRUE, 4); 


gtk container add(GTK CONTAINER (hbox), label); 
gtk container add(GTK CONTAINER (hbox), widget); 


gtk container add(box, hbox); 

) 

(3) print_active 是 另 一 个 辅助 函数 ， 它 以 一 个 描述 字符 串 的 形式 输出 给 定 GtkToggleButton 的 
当前 状态 。 它 在 button_clicked 函 数 中 被 调用 ， 该 函数 是 一 个 与 OK 按钮 的 clicked 信 号 相连 接 的 回 
调 函数 。 每 次 这 个 按钮 被 点 击 时 ， 你 都 将 获得 一 个 按钮 状态 的 输出 信息 。 

void print active(char * button name, GtkToggleButton *button) 


{ 
gboolean active = gtk toggle button get active(button); 





printf('$s is %s\n", button name, active?'active* 
} 


not active"); 


void button clicked(GtkWidget *button, gpointer data) 
{ 


print_active ("Checkbutton", GTK_TOGGLE_BUTTON(checkbutton)); 
print active(*Togglebutton', GTK_TOGGLE_BUTTON(togglebutton)); 
print.active(*Radiobuttonl', GTK TOGGLE, BUTTON (radiobuttonl]); 
print active(*Radiobutton2*, GTK TOGGLE BUTTON (radiobutton2)); 
printf(*Wn*); 

) 


(4) 在 main 函 数 中 ， 你 创建 按钮 构件 ， 将 它们 放 在 一 个 cckvbox 中 并 加 上 描述 标签 ， 然 后 将 回调 信 
号 连接 到 OK 按钮 : 
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gint main (gint argc, gchar *argv[]) 
t 

GtkWidget *window; 

GtkWidget *button; 

GtkWidget *vbox; 


gtk init (kargc, &argv); 
window = gtk window new(GTK WINDOW TOPLEVEL); 
gtk window set default size(GTK WINDOW(window), 200, 200); 
g-signal connect ( GTK OBJECT (window), "destroy", 
GTK SIGNAL FUNC (closeApp), NULL); 


button = gtk button new with label("*Ok*); 
togglebutton = gtk toggle button new with, label(*Toggle*); 
checkbutton = gtk check button new(); 

radiobuttonl = gtk radio button new(NULL); 





radiobutton2 = gtk radio, button, new from widget(GTK, RADIO. BUTTON (radiobuttonl)]; 


Vbox = gtk vbox new (TRUE, 4); 

add widget with label (GTK CONTAINER (vbox), 
add widget with label (GTK CONTAINER (vbox), ， Checkbutton); 
add widget with label (GTK CONTAINER(vbox), "Radio 1:*, radiobuttonl); 
add widget with label (GTK CONTAINER(vbox), "Radio 2:", radiobutton2); 
add widget with label (GTK CONTAINER(vbox), "Button:", button); 








g.signal connect(GTK OBJECT(button), *clicked", 
GTK SIGNAL FUNC(button clicked), NULL); 


gtk container add(GTK CONTAINER(window), vbox); 
gtk. widget. show All (window); 
gtk main (); 


return 0; 


) 


图 16-10 显 示 了 buttons.c 程 序 的 运行 情况 ， 里 面 有 4 种 常见 类 型 的 GtkButton。 
ar 





heckbutton is active 
Togglebutton is active 
|nadiouttenl is active 
|Radiebutten2 is mat active 


u 








*, togglebutton); 
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点 击 OK 可 以 看 到 各 种 按钮 的 状态 。 

这 个 程序 是 一 个 简单 的 示例 , 它 使 用 了 4 种 类 型 的 GtkButton, 并 显示 了 你 如 何 通过 一 个 单独 的 函 
数 gtk_toggle_button_get_active 来 读 取 GtkToggleButton、GtkcheckButton 和 GtkRadio- 
Button 的 状态 。 这 是 面向 对 象 方法 最 大 的 好 处 之 一 ， 因 为 你 不 需要 为 每 个 button 类 型 准备 单独 的 
get_active 函 数 ， 从 而 减少 了 代码 量 。 


16.5.5 GtkTreeView 


至 此 ， 我 们 已 看 到 了 一 些 简单 的 GTK+ 构 件 ， 但 并 不 是 所 有 的 构件 都 是 单行 输入 或 显示 的 。 
Gtkwiaget 的 复杂 性 也 没有 受到 任何 限制 , GtkTreeview 就 是 一 个 很 好 的 例子 , 它 封装 了 大 量 的 功能 ， 
GtkWidget 
+----GtkContainer 
+----GtkTreeView 


GtkTreeview 是 GTK+ 2 新 增 的 构件 族 的 一 部 分 , 它 可 以 创建 电子 表格 或 文件 管理 器 中 常见 的 数据 
的 树 和 列表 视图 。 通 过 cckTrreeview， 你 可 以 创建 数据 、 混 合 文本 、 位 图 、 甚 至 是 使 用 GtkEncry 构 件 
输入 的 数据 等 的 复杂 视图 。 

测试 crkTreevView 最 快速 的 方法 就 是 运行 GTK+ 自 带 的 gtk-aemo 应 用 程序 。 这 个 演示 程序 展示 了 
包括 GtkTreeview 在 内 的 各 种 GTK+ 构 件 的 能 力 ， 如 图 16-11 所 示 。 








GtkTreeView 构 件 族 由 下 面 4 个 组 件 构成 。 

口 GtkTreeView: 树 和 列表 视图 

口 GtkTreeViewColumn: 代表 一 个 列表 或 树 的 列 

口 ctkcellRenderer: 控制 绘图 单元 

口 GtkTreeModel: 代表 树 和 列表 数据 

前 3 个 组 成 了 所 谓 的 视图 (view)， 最 后 一 个 是 模型 (model) 。 这 种 将 视图 和 模型 分 开 的 概念 ( 通 
常 称 为 模型 /视图 /控制 器 设计 模式 ， 或 简称 为 MVC) 并 不 是 GTK+ 专 有 的 ， 而 是 一 个 在 整个 软件 行业 
越 来 越 受到 青睐 的 设计 模式 。 

MVC 设 计 模 式 的 主要 优点 是 , 数据 可 以 同时 由 不 同 的 视图 展示 ,而 不 需要 进行 不 必要 的 复制 。 例 
如 ， 文 本 编辑 器 可 以 分 不 同 的 窗 格 来 编辑 文档 的 不 同 部 分 ， 而 不 需要 在 内 存 中 保留 文档 的 两 个 副本 。 
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MVC 模 式 在 Web 编 程 中 也 很 受 欢 迎 , 这 是 因为 它 使 得 你 可 以 轻松 创建 一 个 满足 如 下 要 求 的 Web 站 
点 : 使 用 与 桌面 浏览 器 不 同 的 方式 在 手机 或 WAP 浏 览 器 上 展示 内 容 。 你 只 需 针对 每 种 浏览 器 类 型 开发 
独立 优化 的 视图 组 件 即 可 。 你 还 可 以 将 获取 数据 的 逻辑 (如 查询 数据 库 ) 与 用 户 界面 逻辑 相 分 离 。 

我 们 先 来 介绍 模型 组 件 ，GTK+ 有 两 个 这 样 的 组 件 : GtkTreestore 用 于 存储 如 目录 层次 结构 这 样 
的 多 级 数据 ，GtkListstore 用 于 存储 平面 数据 。 

为 了 创建 一 个 GtkTreestore， 你 需要 传递 一 个 列 数 ， 接 着 是 每 列 的 类 型 : 

Gtkwidget *store = gtk tree store new (3, G TYPE STRING, G TYPE INT, 

'G, TYPE, BOOLEAN) ; 

AstorerikHR. Om. MARERE EHE ockTreerterfüMg. Xe COR k HIH ER 
中 的 节点 或 列表 中 的 行 ) ， 并 对 可 能 非常 大 的 数据 结构 中 的 一 部 分 进行 定位 和 操纵 。 有 好 几 个 API 
函数 可 以 获取 树 中 不 同位 置 的 迭代 器 对 象 ， 但 我 们 将 只 介绍 最 简单 的 gtk_tree_store_append。 

在 向 树 score 中 添加 任何 数据 之 前 ， 你 需要 一 个 迭代 器 对 象 来 指向 一 个 新 行 。gtk_tree_store_ 
appenad 在 树 中 填 入 一 个 GtrTreeIcer 对 象 ， 该 对 象 代 表 一 个 新 行 ， 这 个 新 行 或 是 一 个 顶层 行 ( 如 果 你 
传递 的 第 三 个 参数 是 NULL)， 或 者 是 一 个 子 行 ( 如 果 你 传递 的 第 三 个 参数 是 父 行 的 迭代 器 对 象 )。 

GtkTreeIter iter; 

gtk tree store append (store, &iter, NULL); 

- 旦 有 了 一 个 迭代 对 象 ， 你 就 可 以 通过 gtk_cree_store_set 来 填充 该 行 : 
gtk tree store set (store, &iter, 
0, "Def Leppard*, 
1, 1987, 
2, TRUE, 
n 

你 成 对 地 传递 列 号 和 数据 ， 以 -1 结束 。 你 将 在 后 面 使 用 一 个 枚 举 类 型 来 增加 列 号 的 可 读 性 。 

为 给 该 行 增加 一 个 分 支 (一 个 子 行 ) ， 你 只 需 通 过 再 次 调用 gtk_tree_store_append， 并 传递 一 
个 顶层 行 来 为 子 行 创建 一 个 迭代 器 对 象 : 

GtkTreeIter child; 

gtk tree store append (store, &child, &iter); 

你 可 以 在 API 文 档 中 找到 更 多 GtkTreestore 和 GtkListstore 相 关 函 数 的 资料 。 下 面 我 们 将 介绍 
GtkTreeView 视 图 组 件 。 

创建 GtkTreeview 本 身 很 简单 ， 你 只 需要 向 构造 函数 传递 GtkTreestore 或 etkListstore 模 
型 即 可 : 

GtkWidget *view = gtk tree view new with model (GTK TREE MODEL (store)); 


现在 是 配置 构件 让 它 准确 显示 数据 的 时 候 了 .针对 每 列 , 你 都 必须 定义 一 个 GtkcellRenderer( 演 
染 器 对 象 ) 并 设置 数据 源 。 例 如 ， 你 可 以 选择 只 显示 某 些 列 或 交换 列 的 显示 顺序 。 

GtkCellRenderer 是 一 个 用 于 处 理 在 屏幕 上 绘制 每 个 单元 格 的 对 象 。 它 有 3 个 子 类 ， 分 别 用 于 处 
理 文本 单元 格 、 位 图 图 形 单元 格 和 开关 按钮 单元 格 ， 如 下 所 示 : 

O GtkCellRendererText; 

O GtkCellRendererPixBuf: 

O GtkCellRendererToggle. 
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你 将 在 视图 中 使 用 文本 泻 染 器 GtkCellRendererText: 


GtkCellRenderer *renderer = gtk cell renderer text new (); 
gtk tree view insert column with attributes (GTK TREE VIEW(view), 
0, 
"This is the column title", 
renderer, 
*text*, 0, 
NULL); 

这 里 你 创建 了 泻 染 器 对 象 并 将 它 传递 给 列 插入 函数 。 这 个 函数 通过 传递 给 它 的 以 NULL 结 尾 的 键 / 
值 对 ， 一 次 就 设置 好 了 GtkCellRendererText 属 性 。 传 给 函数 的 参数 分 别 是 树 视图 、 列 号 、 列 标题 、 
泻 染 器 对 象 和 泻 染 器 属性 。 这 里 你 设置 了 text 属 性 ， 传 递 了 数据 源 的 列 号 。GtkCellRendererText 
还 定义 了 其 他 几 个 属性 ， 包 括 下 划 线 、 字 体 、 大 小 等 。 

你 将 在 下 面 的 例子 中 看 到 GckTreeview 的 实际 使 用 情况 。 


*ow GtkTreeView 


输入 这 个 程序 ， 将 它 命名 为 Eree.c. 
(D 程序 使 用 一 个 枚 举 类 型 来 标记 列 ， 这 样 你 就 可 以 用 名 字 来 引用 它们 。N_coLUMNs 是 总 列 数 。 
#include «gtk/gtk.h» 





enum ( 
COLUMN TITLE, 
COLUMN ARTIST, 
COLUMN. CATALOGUE, 
N. COLUMNS 

»u 


void closeApp ( GtkWidget *window, gpointer data) 
{ 
gtk main quit(); 


int main (int argc, char *argv[1) 
t 
GtkWidget *window; 
GtkTreeStore *store; 
GtkWidget *view; 
GtkTreelter parent iter, child iter; 
GtkCellRenderer *renderer; 


gtk init(kargc, &argv); 
window = gtk window new(GTK WINDOW TOPLEVEL); 
gtk window set default size ( GTK WINDOW(window), 300, 200); 
g.signal connect ( GTK OBJECT (window), "destroy", 
GTK SIGNAL FUNC ( closeApp), NULL); 


(2) 下 面 创建 了 树 score， 并 向 其 传递 列 的 总 数 和 每 列 的 类 型 : 


Store = gtk tree store new (N COLUMNS, G TYPE STRING, G TYPE STRING, 
G TYPE STRING) ; 
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(3) 接 下 来 向 树 中 增加 一 个 父 行 和 一 个 子 行 : 


gtk tree store append (store, &parent iter, NULL); 


gtk tree store set (store, &parent iter, COLUMN TITLE, "Dark Side of the Moon", 
COLUMN ARTIST, "Pink Floyd", 
COLUMN CATALOGUE, "B000024D4P", 
EI 


gtk tree store append (store, &child iter, &parent iter]; 


gtk tree store set (store, &child iter, COLUMN TITLE, "Speak to Me", 
21) 


view = gtk tree view new with model (GTK TREE MODEL (store)); 
(4) 最 后 ， 把 列 加 到 视图 中 ， 并 设置 它们 的 数据 源 和 标题 : 


renderer = gtk cell renderer text new (]; 

gtk tree view insert column with attributes (GTK TREE VIEW(view), 
COLUMN TITLE, 
"Title", renderer, 
"text', COLUMN TITLE, 
NULL) ; 

gtk tree view insert column with attributes (GTK, TREE VIEW(view), 
COLUMN ARTIST, 
"Artist', renderer, 
"text", COLUMN ARTIST, 
NULL); 

gtk tree view insert column with attributes (GTK TREE VIEW(view), 
COLUMN, CATALOGUE, 
"Catalogue", renderer, 
"text", COLUMN CATALOGUE, 
NULL); 


gtk container add(GTK CONTAINER(window), view); 


gtk widget. show, a11 (window); 
gtk main (); 


return 0; 
H 


后 面 会 把 GtkTreeView 作 为 CD 应 用 程序 的 核 
GtkTreeView 的 代码 。 

我 们 已 经 了 解 了 GTK+ 构 件 ， 现 在 我 们 将 把 注意 力 转向 GNOME。 后 面 我 们 将 学 习 如 何 使 用 
GNOME 库 向 应 用 程序 中 添加 菜单 ， 以 及 GNOME 构 件 是 如 何 使 得 为 GNOME 桌 面 编程 变 得 更 容易 。 
16.6 GNOME 构件 


GTK+ 被 设计 成 独立 于 桌面 的 。 也 就 是 说 ，GTK+ 并 不 假定 它 运行 在 GNOME 中 ， 甚 至 不 假定 它 运 


在 该 程序 中 查询 CD 数据 库 时 ， 我 们 将 修改 
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行 在 Linux 上 。 这 样 ，GTK+ 就 可 以 被 相对 容易 地 移植 到 Windows 或 者 任何 其 他 视窗 系统 中 。 可 这 样 导 
致 的 结果 是 , GTK+ 缺 乏 将 程序 与 桌面 紧密 结合 的 方法 , 例如 保存 程序 配置 、 显 示 帮 助 文件 或 编写 applet 
(applet 是 在 边缘 面板 上 运行 的 小 程序 ) 的 方法 。 
GNOME 库 包含 GNOME 构 件 ， 它 们 扩展 了 GTK+， 并 用 一 些 更 容易 使 用 的 构件 替换 了 GTK+ 中 的 
部 分 构件 。 在 本 节 中 ， 我 们 将 看 到 如 何 用 GNOME 构 件 来 编程 。 
在 使 用 GNOME 库 之 前 , 你 必须 在 程序 的 一 开始 对 它们 进行 初始 化 , 就 像 你 在 使 用 GTK+ 时 所 做 的 
那样 。 你 在 纯 GTK+ 程 序 中 调用 的 是 gtk_init， 在 这 里 调用 的 是 gnome_program_init。 
这 个 函数 的 参数 有 : app_id 和 app_version (用 于 向 GNOME 描 述 你 的 程序 ) , module_info ( 告 
诉 GNOME 初 始 化 哪个 库 模块 ) 、 命 令 行 参 数 和 应 用 程序 属性 (设置 为 以 vuLL 结 尾 的 “名 / 值 ” 对 列表 )。 
GnomeProgram* gnome program init (const char *app id, const char *app version, 
const GnomeModuleInfo *module info, 
int argc, char **argv, 
const char *first property name, 
e) 


可 选 的 属性 列表 用 来 设置 一 些 属性 ， 如 位 图 查找 目录 。 


殉国 —rcNoMERH 


现在 让 我 们 来 看 一 个 GNOME 程 序 ， 注 意 G6tkwindow 在 GNOME 中 被 替代 为 GnomeApp 构 件 。 
输入 这 个 程序 ， 将 它 命名 为 gnomel .c: 


#include <gnome.h> 
int main (int argc, char *argv[]) 
GtkWidget *app; 


gnome program init (*gnomel*, *1.0*, MODULE, argc, argv, NULL); 
app = gnome app new ("gnomel', "The Window Title"); 

gtk widget show(app); 

gtk main (); 


return 0; 


) 

为 编译 这 个 程序 ， 你 需要 包含 GNOME 头 文件 ， 因此 传递 Jibgnomeui 和 1ibgome 给 pkg-config: 

$ gcc gnomel.c -o gnomel ‘pkg-config --cflags --libs libgnome-2.0 libgnomeui-2.0 

Gnomeapp 构 件 对 Gtkwindow 进 行 了 扩展 ， 使 得 添加 菜单 、 工 具 栏 以 及 底部 的 状态 栏 变 得 很 容易 。 
因为 cnomeapp 继 承 自 Gtkwindow， 所 以 你 可 以 将 Gnomeapp 构 件 用 于 任何 Gtkwindow 函 数 。 接 下 来 ， 你 
将 学 习 创 建 菜 单 。 在 本 章 最 后 一 个 例子 中 ， 你 将 添加 一 个 状态 栏 。 


你 可 以 使 用 GTK+ 来 创建 菜单 ， 但 GNOME 所 提供 的 结构 和 宏 使 得 这 个 工作 变 得 更 容易 
T. 在线 的 GTK+ 文 档 描述 了 如 何 使 用 GTK+ 来 创建 菜单 。 


16.7 GNOME 菜单 
在 GNOME 中 创建 一 个 下 拉 式 的 菜单 栏 非常 简单 。 菜 单 栏 中 的 每 个 菜单 都 由 一 个 GNOMEUIInfo 结 
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构 的 数组 来 表示 ， 数 组 中 的 每 个 元 素 对 应 于 一 个 菜单 项 。 例 如 ， 如 果 你 有 File、Edit、View 3 个 菜单 ， 
就 用 3 个 数组 来 分 别 描述 每 个 菜单 的 内 容 。 

一 旦 定义 好 每 个 菜单 ， 你 就 可 以 通过 在 另 一 个 GNOMEUIInfo 结 构 的 数组 中 引用 这 些 数组 来 创建 菜 
单 栏 本 身 。 

GNOMEUIInfo 结 构 有 点 复杂 ， 需 要 解释 一 下 : 


typedef struct { 
GnomeUIInfoType type; 
gchar const *label; 
gchar const *hint; 
gpointer moreinfo; 
gpointer user data; 
gpointer unused data; 
GnomeUIPixmapType pixmap type; 
gconstpointer pixmap info; 
guint accelerator key; 
GdkModifierType ac mods; 
GtkWidget *widget; 

) GnomeUIInfo; 


该 结构 中 的 第 一 项 type 定 义 了 菜单 元 素 的 类 型 。 它 可 以 是 GNOME 定 义 的 10 个 GnomeUIInfoType 
类 型 中 的 一 个 ， 如 表 16-3 所 示 。 








表 16-3 
GnomeUIInfoType w m 

GNOME, APP. UI, ENDOFINFO 表示 这 是 数组 中 最 后 一 个 菜单 项 

GNOME, APP, UI ITEM 个 普通 的 菜单 项 ， 或 一 个 单 选 按钮 《如 果 前 面 是 一 个 GNOME_APP_ 
UI_RADIOITEMS 项 的 话 ) 

GNOME_APP_UI_TOGGLEITEM -个 开关 按钮 或 检查 框 按钮 菜单 项 

GNOME, APP. UI. RADIOITEMS 个 单 选 按钮 组 

GNOME, APP UI SUBTREE 表示 该 元 素 是 一 个 子 菜单 。 设 置 moreinfo 以 指向 子 菜单 数组 

GNOME_APP_UI_SEPARATOR 在 菜单 中 插入 一 个 分 割 线 

GNOME APP UI HELP 创建 一 个 在 “帮助 ”菜单 中 使 用 的 帮助 主题 列表 

GNOME_APP_UI_BUILDER_DATA 为 接 下 来 的 项 目 指定 构造 数据 

GNOME, APP UI ITEM CONFIGURABLE -个 可 配置 的 菜单 项 

GNOME, APP UI. SUBTREE, STOCK 除了 标签 文本 需要 在 gnome-libs 目 录 中 查找 以 外 ， 与 GNOME_APP_ 
UI_SUBTREE 相 同 

GNOME. APP UI INCLUDE 除了 这 个 项 目 是 包含 在 当前 菜单 中 而 不 是 作为 一 个 子 菜单 以 外 ， 和 


GNOME_APP_UI_SUBTREE 相 同 


该 结构 中 的 第 二 个 和 第 三 个 成 员 定义 菜单 项 的 文本 和 弹出 提示 (提示 显示 在 窗口 底部 的 
状态 栏 中 ) 。 
moreinfo 的 目的 取决 于 type。 对 ITEM 和 TOGGLEITEM， 它 指向 菜单 项 被 激活 时 调用 的 回调 函数 。 
对 RADIOITEMS， 它 指向 一 个 定义 单 选 按钮 组 的 GnomeUIInfo 结 构 数组 。 
user_data 是 一 个 传递 给 回调 函数 的 任意 指针 。pixmap_type 和 pixmap_info 用 于 为 菜单 项 增加 
一 个 位 图 图 标 ，accelerator_key 和 ac_modes 用 于 定义 一 个 快捷 键 。 
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最 后 ，wiGget 用 于 在 内 部 保存 由 菜单 创建 函数 指向 的 菜单 项 构件 。 


实验 GNOMER Æ 


你 可 以 通过 这 个 小 程序 来 试 一 试 菜单 ， 这 个 程序 名 为 menul .c。 
finclude «gnome.h» 


void closeApp ( GtkWidget *window, gpointer data) 
t 


gtk main quit(); 


(D 为 菜单 项 定义 一 个 回调 函数 icem_cl ickedG: 
void item clicked(GtkWidget *widget, gpointer user data) 
{ 


printf ("Item Clicked!\n"); 


(2) 接 下 来 是 菜单 定义 。 你 有 一 个 子 菜单 、 一 个 顶层 菜单 和 一 个 菜单 栏 数组 : 
static GnomeUIInfo submenu[] = ( 

(GNOME APP UI ITEM, "SubMenu", "SubMenu Hint", 

GTK SIGNAL FUNC(item clicked), NULL, NULL, 0, NULL, 0, 0, NULL), 

(GNOME APP UI ENDOFINFO, NULL, NULL, NULL, NULL, NULL, 0, NULL, 0, 0, NULL) 
和 


static GnomeUIInfo menu[] = ( 
(GNOME APP.UI ITEM, "Menu Item 1*, "Menu Hint*, 
NULL, NULL, NULL, 0, NULL, 0, 0, NULL), 
(GNOME APP.UI SUBTREE, "Menu Item 2", "Menu Hint", submenu, 
NULL, NULL, 0, NULL, 0, 0, NULL), 
(GNOME APP UI ENDOFINFO, NULL, NULL, NULL, NULL, NULL, 0, NULL, 0, 0, NULL) 


static GnomeUIInfo menubar[] = ( 

(GNOME APP UI SUBTREE, "Toplevel Item*, NULL, menu, NULL, 

NULL, 0, NULL, 0, 0, NULL), 

(GNOME APP.UI ENDOFINFO, NULL, NULL, NULL, NULL, NULL, 0, NULL, 0, 0, NULL) 
Nu 


(3) 在 main 函 数 中 ， 进 行 一 些 初始 化 ， 然 后 创建 cnomeapp 构 件 并 设置 菜单 : 


int main (int argc，char *argv[]) 
t 
GtkWidget *app; 


gnome program init (*gnomel', *0.1", LIBGNOMEUI MODULE, 
argc, argv, 
GNOME PARAM NONE); 

app = gnome app new(*gnomel*, "Menus, menus, menus"); 


gtk window set default size ( GTK WINDOW(app), 300, 200); 
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g-signal connect ( GTK OBJECT (app), "destroy", 
GTK SIGNAL FUNC ( closeApp), NULL); 


gnome app create menus ( GNOME APP(app), menubar); 
gtk widget show(app); 


gtk main(); 
return 0; 


) 

试 着 运行 mnenu1 程 序 ， 你 可 以 看 到 菜单 栏 、 子 菜单 及 回调 函数 Menue, menis, menus 
的 实际 运行 情况 ， 如 图 16-12 所 示 。 level it 

GnomeUIInfo 结 构 对 程序 员 不 是 太 友好 ， 因 为 它 包含 11 个 成 
员 ， 大 多 数 成 员 的 值 在 通常 情况 下 都 是 NULL 或 零 。 你 在 输入 它们 
的 时 候 很 容易 出 错 ， 而 且 在 一 个 很 长 的 菜单 项 数组 中 ， 你 很 难 将 
它们 区 分 。 为 了 改善 这 种 情况 ，GNOME 定 义 了 宏 来 减少 手工 
输入 的 麻烦 。 这 些 宏 还 可 以 增加 图 标 和 键盘 快捷 键 ， 而 不 需要 任 
何 开销 。 事 实 上 ， 我 们 没有 任何 理由 不 使 用 这 些 宏 

有 两 组 宏 ， 第 一 组 定义 单独 的 菜单 项 。 它 们 需要 两 个 参数 : 图 16-12 
回调 函数 指针 和 用 户 数据 。 

#include <libgnomeui/libgnomeui.h> 









#define GNOMEUIINFO MENU OPEN ITEM (cb, data) 
d define GNOMEUIINFO MENU SAVE ITEM (cb, data) 
d define GNOMEUIINFO MENU SAVE AS ITEM (cb, data) 
define GNOMEUIINFO MENU PRINT ITEM (cb, data) 
ddefine GNOMEUIINFO MENU PRINT SETUP ITEM(cb, data) 
define GNOMEUIINFO MENU CLOSE ITEM (cb, data) 
ddefine GNOMEUIINFO MENU EXIT ITEM (cb, data) 
ddefine GNOMEUIINFO MENU QUIT ITEM (cb, data) 
define GNOMEUIINFO MENU CUT ITEM (cb, data) 
define GNOMEUIINFO MENU COPY ITEM (cb, data) 
#define GNOMEUIINFO MENU PASTE ITEM (cb, data) 
#define GNOMEUIINFO MENU SELECT ALL ITEM(cb, data) 
+ etc 

第 二 组 用 于 项 层 菜单 ， 你 只 需 传递 数组 即 可: 

#define GNOMEUIINFO MENU FILE TREE (tree) 
ddefine GNOMEUIINFO MENU EDIT TREE (tree) 
ddefine GNOMEUIINFO MENU VIEW TREE (tree) 
#define GNOMEUIINFO MENU SETTINGS TREE (tree) 
#define GNOMEUIINFO MENU FILES TREE (tree) 
#define GNOMEUIINFO MENU WINDOWS TREE (tree) 
#define GNOMEUIINFO MENU HELP TREE (tree) 
#define GNOMEUIINFO MENU GAME TREE (tree) 





实 验 使 用 enome 宏 来 定义 菜单 
在 本 例 中 ， 我 们 通过 这 些 菜单 来 看 看 宏 是 怎样 工作 的 。 对 menul.c 做 如 下 改动 ， 并 将 它 保存 为 
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menu2.c (为 简单 起 见 ， 本 例 中 的 菜单 选择 没有 定义 回调 函数 。 本 例 只 是 为 了 说 明 GNOME 菜 单 宏 的 便利 )。 


#include «gnome.h» 


static GnomeUIInfo filemenu[] = ( 
GNOMEUIINFO MENU NEW. ITEM ("New", "Menu Hint", NULL, NULL ), 
GNOMEUIINFO MENU OPEN ITEM (NULL, NULL), 
GNOMEUIINFO MENU. SAVE AS ITEM (NULL, NULL), 
GNOMEUIINFO SEPARATOR, 
GNOMEUIINFO MENU EXIT ITEM (NULL, NULL), 
GNOMEUIINFO END 


static GnomeUIInfo editmenu[] = ( 
GNOMEUIINFO MENU FIND ITEM (NULL, NULL), 
GNOMEUIINFO. END 


static GnomeUIInfo menubar[] = ( 
GNOMEUIINFO MENU FILE TREE (filemenu), 
GNOMEUIINFO MENU EDIT. TREE (editmenu), 
GNOMEUIINFO END 


int main (int argc, char *argv(]) 
( 
GtkWidget *app, *toolbar; 


gnome program init (*gnomel', "0.1", LIBGNOMEUI MODULE, 
argc, argv, 
GNOME PARAM NONE); 
app = gnome app new(*gnomel*, "Menus, menus, menus"); 
gtk window set default size ( GTK WINDOW(app), 300, 200); 
gnome app create menus ( GNOME APP(app), menubar); 


gtk widget, show(app) ; 


gtk main(); 
return 0; 


) 

通过 在 menu2 .c 中 使 用 libgnomeui 宏 , 极 大 地 减少 了 需要 输 
入 的 代码 量 ， 并 使 菜单 代码 更 容易 理解 了 。 这 些 宏 不 仅 节省 了 开 
发 者 时 间 和 精力 ， 还 有 助 于 创建 菜单 并 使 菜单 的 字体 、 键 盘 快捷 
方式 和 图 标 与 其 他 GNOME 程 序 保持 一 致 。 在 程序 开发 中 ， 我 们 
应 该 尽 可 能 多 地 使 用 这 些 宏 。 

图 16-13 显 示 了 menu3.c 的 运行 情况 ， 它 拥有 一 个 标准 化 的 
GNOME 菜 单项 。 


16.8 对话 框 








GUI 应 用 程序 的 一 个 重要 组 成 部 分 就 是 与 用 户 交互 并 通知 用 户 重要 的 事件 。 通 常 ， 你 会 为 此 创建 
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个 临时 的 带 有 OK 和 Cancel 按 钮 的 窗口 .如 果 信息 非常 重要 , 它 需要 一 个 立即 响应 (如 删除 一 个 文件 )， 

你 就 希望 能 够 阻止 用 户 访问 任何 其 他 窗口 ， 直 到 他 做 出 了 一 个 选择 〈 这 类 窗口 被 称 为 模式 对 话 框 ) 。 

我 们 在 这 里 讲述 的 就 是 对 话 框 。GTK+ 提 供 了 一 个 从 Gtkwindow 派 生 的 特殊 对 话 框 构件 ， 可 以 让 
编程 变 得 更 加 容易 。 


16.8.1 GtkDialog 


正如 你 所 看 到 的 ，GtkDialog 是 Gtkwindow 的 一 个 子 类 ， 因 此 它 继承 了 GtkwinGow 的 所 有 函数 和 
属性 : 


GtkWindow 
*----GtkDialog 
GtkDialog 将 窗口 分 为 两 个 区 域 ， 一 个 放 构 件 的 内 容 ， 一 个 放 底部 的 按钮 。 你 可 以 在 创建 对 话 框 
时 指定 你 想 要 的 按钮 和 其 他 对 话 框 设置 。 
GtkWidget* gtk dialog new with buttons (const gchar *title, 
GtkWindow *parent, 
GtkpialogFlags flags, 
const gchar *first button text, 
m" 
这 个 函数 创建 了 一 个 完整 的 带 有 标题 和 按钮 的 对 话 框 窗口 。 第 二 个 参数 parent 应 指向 应 用 程序 的 
主 窗口 ， 这 样 GTK+ 才 可 以 确保 对 话 框 是 一 直 连 接 到 主 窗口 的 。 当 主 窗口 被 最 小 化 时 ， 它 也 会 跟着 最 
小 化 。 
flags 参 数 决定 了 对 话 框 可 以 拥有 的 属性 组 合 : 
O GTK_DIALOG_MODAL: 
O GTK_DIALOG_DESTROY_WITH_PARENT; 
O GTK_DIALOG_NO_SEPARATOR. 
你 可 以 将 这 些 标记 用 按 位 或 操作 符 组 合 起 来 ， 例 如 ， CGTK_DIALOG_MODALIGTK_DIALOG_ 
NO_SEPARATOR) 既是 一 个 模式 对 话 框 ， 又 是 一 个 在 主 窗口 区 域 和 按钮 区 域 之 间 没有 分 割 线 的 对 话 框 。 
其 余 的 参数 是 一 个 以 wuLL 结 尾 的 按钮 和 相应 的 响应 代码 列表 。 你 将 在 后 面 看 到 gtk_aialog_run 
函数 时 明白 响应 代码 的 含义 。 通 常 ， 你 会 从 GTK+ 定 义 好 的 一 系列 按钮 中 进行 选择 ， 这 些 按钮 中 也 有 
定义 好 的 图 标 。 
下 面 显示 了 创建 一 个 带 有 OK 和 Cancel 按 钮 的 对 话 框 的 代码 ， 它 会 根据 按 下 的 按钮 分 别 返回 
GTK_RESPONSE_ACCEPT 和 GTK_RESPONSE_REJECT: 
GtkWidget *dialog = gtk dialog new with buttons ("Important question", 
parent window, 
GTK DIALOG DESTROY WITH PARENT, 
GTK STOCK OK, GTK RESPONSE ACCEPT, 
GTK STOCK CANCEL, GTK RESPONSE REJECT, 
NULL); 
我 们 在 这 里 选择 创建 两 个 按钮 ， 但 是 对 话 框 并 没有 限制 可 以 放置 的 按钮 数目 。 此 外 ， 你 可 以 从 一 
组 响应 类 型 标记 中 进行 选择 。accept 和 reject 标 记 没有 被 标准 GNOME 使 用 ， 因 此 你 可 以 随意 在 应 用 程 
序 中 使 用 它们 ( 记 住 ， 在 你 的 应 用 程序 中 ，accept 应 意味 着 接受 ) 。 其 他 在 这 里 可 以 使 用 的 标记 包括 
OK 和 CANCEL， 具 体 请 见 下 一 节 中 的 GtkResponseType 枚 举 类 型 。 
当然 ， 你 需要 向 对 话 框 中 添加 内 容 ， 这 个 GtkDialog 包 含 一 个 现成 的 GtkvBox 来 容纳 构件 。 你 直 
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接 从 这 个 对 象 获得 一 个 指针 : 
GtkWidget *vbox = GTK DIALOG(dialog)-»vbox; 


你 以 通常 的 方式 使 用 这 个 GtkvBox， 比 如 通过 gtk_box_pack_start 或 者 其 他 类 似 的 函数 。 
- 旦 创建 好 一 个 对 话 框 ， 下 一 步 就 是 将 它 展现 给 用 户 ， 并 等 待 响 应 。 这 可 以 使 用 下 面 两 种 方法 来 
完成 :一 种 是 模式 的 方法 ， 它 阻止 除 对 话 框 以 外 的 一 切 输入 ; 一 种 是 非 模式 的 方法 ， 它 像 对 待 其 他 窗 
口 一 样 对 待 对 话 框 。 让 我 们 先 看 看 运行 一 个 模式 对 话 框 。 


16.82 ”模式 对 话 框 


模式 对 话 框 强制 用 户 首先 响应 ， 然 后 才能 进行 任何 其 他 动作 。 它 对 以 下 这 些 情况 很 有 用 : 用 户 将 
要 做 一 件 有 严重 后 果 的 事情 ， 或 报告 错误 和 警告 信息 。 
你 可 以 通过 设置 GTk_DIALOG_MODAL 标 记 和 调用 gtk_widget_show 函 数 ， 使 一 个 对 话 框 变 为 模式 
对 话 框 。 但 还 有 一 个 更 好 的 方法 。gtk_qialog_run 通 过 阻止 程序 的 进一步 执行 ， 直 到 一 个 按钮 被 按 
下 ， 来 帮 你 解决 这 个 难题 。 
当 用 户 按 下 一 个 按钮 (或 者 对 话 框 被 关闭 ) 时 ，gtk_aialog_run 返 回 一 个 int 类 型 的 结果 来 表明 
用 户 按 下 了 哪个 按钮 。GTK+ 通 常 定义 一 个 枚 举 类 型 来 描述 可 能 的 值 : 
typedef enum 
{ 
GTK_RESPONSE_NONE = -1, 
GTK RESPONSE REJECT 2, 
GTK RESPONSE ACCEPT = -3, 
GTK RESPONSE DELETE EVENT = -4 
GTK RESPONSE OK = -5, 
GTK RESPONSE CANCEL = -6, 
GTK RESPONSE CLOSE = -7, 
GTK RESPONSE YES = -8, 
GTK RESPONSE NO = 
GTK_RESPONSE_APPLY = 
GTK_RESPONSE_HELP = 
) GtkResponseType; 


现在 我 们 可 以 解释 传递 给 gtk_aialog_new_with_buttons 的 结果 代码 了 。 结 果 代 码 是 在 按钮 被 
按 下 时 ，gtk_adialog_run 返 回 的 一 个 GtkResponseType 值 。 如 果 对 话 框 被 关闭 (例如 用 户 点 击 了 关 
闭 图 标 )， 你 将 得 到 一 个 GTK_RESPONSE_NONE 的 结果 。 

switch 结 构 非常 适合 于 执行 这 个 逻辑 流程 : 

GtkWidget *dialog = create_dialog(); 

int result = gtk dialog run(GTK DIALOG(dialog)); 









10, 
-11 





Switch (result) 
t 
Case GTK RESPONSE ACCEPT: 
delete file(); 
break; 
Case GTK RESPONSE REJECT: 
do nothing(); 
break; 
default: 
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dialog was cancelled (); 
break; 


} 
gtk_widget_destroy (dialog); 


这 就 是 GTK+ 中 简单 的 模式 对 话 框 的 所 有 内 容 了 。 正 如 你 所 看 到 的 ， 这 不 需要 你 花费 多 少 精力 或 
编写 多 少 代码 。 最 后 你 只 需 用 gtk_wiaget_gestroy 进 行 清理 。 

但 当 你 需要 一 个 非 模式 对 话 框 时 ， 事 情 就 不 是 那么 简单 了 。 你 不 能 使 用 gtk_aialog_run， 而 是 
必须 将 对 话 框 的 按钮 与 回调 函数 连接 。 
16.8.3 非 模式 对 话 杠 

你 已 看 到 如 何 用 gek_aialog_run 米 创建 一 个 模式 阻塞 ) 对 话 框 了 。 非 模式 对 话 框 的 工作 方式 
稍 有 不 同 ， 尽 管 它们 是 用 同一 种 方法 创建 的 。 你 不 是 调用 gtk_aialog_run, 而 是 将 一 个 回调 函数 连 
接 到 cckpialog 的 "response* 信 号 《这 个 信号 在 按钮 被 按 下 或 窗口 被 关闭 时 发 出 )， 

将 回调 函数 连接 到 信号 是 按 通常 的 方式 来 完成 的 ， 但 有 一 点 不 同 ， 回调 函数 有 一 个 额外 的 
response 参 数 ， 它 起 着 和 gtk_dialog_run 返 回 值 相同 的 作用 。 下 面 的 代码 片断 显示 了 一 个 非 模式 对 
话 框 的 基本 用 法 : 


void dialog button clicked (GtkWidget *dialog, gint response, gpointer user data) 
C 





switch (response) 


Case GTK RESPONSE, ACCEPT: 
do stu£f(); 
break; 

Case GTK RESPONSE REJECT: 
do. nothing(); 
break; 

default: 
dialog was cancelled (); 
break; 


} 
gtk widget destroy(dialog); 
) 


int main() 
t 


GtkWidget *dialog = create dialog(); 


g-signal connect ( GTK OBJECT (dialog), "response", 
GTK SIGNAL FUNC (dialog button clicked), user data ); 


gtk widget show(dialog); 
i 
非 模式 对 话 框 会 致使 复杂 度 增加 ， 因为 用 户 没有 被 强制 立即 响应 对 话 框 ， 他 可 以 最 小 化 对 话 框 并 
将 它 忘掉 。 你 需要 考虑 ， 如 果 用 户 在 关闭 第 一 个 对 话 框 之 前 又 试图 第 一 次 打开 这 个 对 话 框 时 ， 你 该 如 
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何 做 。 你 要 做 的 就 是 检查 对 话 框 指针 是 否 为 NULL， 如 果 不 是 就 调用 gtk_window_present 来 重新 显示 
已 存在 的 对 话 框 。 你 可 以 在 本 章 最 后 一 节 中 看 到 它 的 实际 使 用 情况 。 


16.8.4 GtkMessageDialog 
对 于 非常 简单 的 对 话 框 来 说 ， 即 使 6tkDialog 也 显得 过 于 复杂 了 : 


GtkDialog 
*----GtkMessageDialog 
通过 使 用 GtkMessageDialog， 你 仅 用 一 行 代码 就 可 以 创建 一 个 消息 对 话 框 。 
GtkWidget* gtk message dialog new (GtkWindow *parent, GtkDialogFlags flags, 
GtkMessageType type, 
GtkButtonsType buttons, 
Const gchar *message format, 
e 


这 个 函数 创建 了 一 个 带 有 图 标 、 标 题 和 可 配置 按钮 的 完整 对 话 框 。 参 数 ype 根 据 对 话 框 的 目的 设 
置 它 的 图 标 和 标题 ， 例 如 ， 警 告 类 型 有 一 个 三 角 警 示 图 标 。 你 最 常 碰 到 的 简单 对 话 框 有 下 面 4 种 可 能 
的 类 型 值 : 

口 GTK_MESSAGE_INFO; 

O GTK_MESSAGE_WARNING; 

O GTK. MESSAGE, QUESTION: 

O GTK. MESSAGE, ERROR. 

你 还 可 以 选择 一 个 GTK_MEssaGE_oTHER 值 ， 它 用 于 前 述 对 话 框 类 型 都 不 适用 的 情况 。 对 于 
GtkMessageDialog， 你 可 以 传递 一 个 GtkButtonsType 而 不 是 分 别 列 出 每 个 按钮 ， 如 表 16-4 所 示 。 





表 16-4 

GtkButtonsType 说 m 
GTK BUTTONS OK OK (确认 ) 按钮 
GTK_BUTTONS_CLOSE Close (关闭 ) 按钮 
GTK BUTTONS CANCEL Cancel (取消 ) 按钮 
GTK. BUTTONS, YES. NO Yecs 和 No 按钮 
GTK_BUTTONS_OK_CANCEL OK 和 Cancel 按 钮 
GTK_BUTTONS_NONE 无 按钮 





剩 下 的 都 是 对 话 框 的 文本 了 , 你 可 以 使 用 替换 字符 串 来 构造 它 , 就 像 在 printf 中 一 样 ,在 本 例 中 ， 
我 们 询问 用 户 是 否 确 实 要 删除 一 个 文件 : 
GtkWidget *dialog = gtk message dialog new (main window, 
GTK DIALOG DESTROY WITH PARENT, 
GTK MESSAGE QUESTION, 
GTK. BUTTONS YES NO, 
"Are you sure you wish to delete $5?", 
filename); 
result - gtk dialog run (GTK DIALOG (dialog]]; 
gtk widget destroy (dialog); 


这 个 对 话 框 如 图 16-14 所 示 。 
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q Ne you sure you wish to delete important txty 


Lor] @x | 
图 16-14 


建 GU Seagepia1o9 是 传递 信息 或 询问 yeso 关 型 问题 的 最 简单 方法 你 将 在 下 - - 节 为 CD 应 用 程 
序 创建 GUI 时 用 到 它 。 
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了 一 个 CD 数据 库 应 用 程序 。 现在 你 将 看 到 ， 用 
开发 一 个 丰富 的 用 户 界面 是 多 么 快捷 。 
一 样 ， 为 运行 本 章 中 的 CD 数据 库 应 用 程序 ， 你 


它 仅 实现 应 用 程序 的 部 分 功能 。 例如 ， 
在 这 个 应 用 程序 里 看 到 本 章 所 介绍 的 构 


O 通过 GUl 登 录 数据 库 ， 

口 查找 CD; 

O 显示 CD 和 曲目 信息 ; 

口 向 数据 库 中 增加 - 张 CD; 

D 创建 一 个 “关于 ”(About) 窗口 ; 

D 在 用 户 退 出 时 进行 确认 。 

你 把 代码 分 为 3 个 源 文 件 ， 它们 共享 同 -个 头 文件 cdapp_gnome.h。 源 文件 将 把 创建 窗口 和 对 话 
杠 的 函数 一 一 界面 生成 函数 与 回调 函数 分 开 . 


Cdapp gnome.h 


先 来 看 看 cdapp_gnome.h， 它 声明 了 那些 你 需要 实现 的 函数 。 

(D 中 全 GNOME 头 文件 和 你 在 第 8 章 中 开发 的 接口 函数 记 对 戌 的 浆 业 人 这 个 示例 程序 使 用 了 第 8 
章 中 的 app_mysql .h 文 件 和 app_mysal cxt, 以 及 该 章 中 创建 的 数据 库 。 

#include <gnome.h> 

#include "app_mysal .hv 


(2) 枚 举 类 型 标记 了 GtkTreeView 构 件 的 列 ， 你 将 用 GtkTreeview 来 显示 CD 和 曲目 信息 : 
enum { 

COLUMN TITLE, 

COLUMN ARTIST, 

COLUMN. CATALOGUE, 

N.COLUMNS 


» 
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(3) 在 interface.c 文 件 中 有 3 个 窗口 创建 函数 : 
GtkWidget *create main window(); 
GtkWidget *create login dialog(); 
GtkWidget *create addcd dialog(); 


(4) 针对 菜单 项 、 工 具 栏 、 对 话 框 按钮 和 搜索 按钮 的 回调 函数 在 callbacks.c 文 件 中 : 


/* Callback to quit application */ 
void quit app( GtkWidget * window, gpointer data); 





/* Callback useful for confirming exit before quitting */ 
gboolean delete event handler ( GtkWidget *window, GdkEvent *event, gpointer data); 


/* Callback connected to 'response' signal of addcd dialog */ 

void addcd dialog button clicked (GtkDialog * dialog, gint response, 
gpointer userdata); 

/* Callback for menu and toolbar 'Add CD' button */ 

void on addcd activate (GtkWidget *widget, gpointer user data); 


/* Callback for menu 'About' button */ 
void on about activate (GtkWidget  *widget, gpointer user data); 


/* Callback for search button */ 
void on search button clicked (GtkWidget *widget, gpointer userdata); 





接着 ， 首 先 来 看 一 下 interface.c， 该 文件 定义 了 你 在 应 用 程序 中 使 用 的 窗口 和 对 话 框 。 
(1) 首先 是 在 callbacks.c 和 main.c 中 引用 的 一 些 构件 指针 : 
#include "app gnome.h* 


GtkWidget *treeview; 
GtkWidget *appbar; 
GtkWidget "artist entry; 
GtkWidget *title entry; 
GtkWidget *catalogue entry; 
GtkWidget *username ent: 
GtkWidget *password ent. 


(2) app 是 一 个 具备 文件 作用 域 的 主 窗口 指针 : 
static GtkWidget *app; 


(3) 定义 一 个 辅助 函数 ， 它 把 一 个 带 有 指定 文本 标签 的 构件 添加 到 容器 中 : 


void add widget with label ( GtkContainer *box, gchar *caption, GtkWidget *widget) 
€ 

GtkWidget *label = gtk label new (caption); 

GtkWidget *hbox - gtk hbox new (TRUE, 4); 
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gtk container add(GTK CONTAINER (hbox), label); 
gtk container add(GTK CONTAINER (hbox), widget]; 


gtk container add(box, hbox); 
Y 


(4) 为 方便 起 见 ， 菜 单 栏 的 定义 使 用 了 GNOMEUIINFO 宏 : 


static GnomeUIInfo filemenu[] = 
t 
GNOMEUIINFO MENU NEW ITEM ("_New CD", NULL, on addcd activate, NULL), 
GNOMEUIINFO SEPARATOR, 
GNOMEUIINFO MENU EXIT ITEM (close app, NULL), 
GNOMEUIINFO END 


static GnomeUIInfo helpmenu[] = 

{ 
GNOMEUIINFO_MENU_ABOUT_ITEM (on_about_activate, NULL), 
GNOMEUIINFO END 


static GnomeUIInfo menubar[] = 
GNOMEUIINFO MENU FILE TREE (filemenu), 


GNOMEUIINFO. MENU HELP. TREE (helpmenu), 
GNOMEUIINFO END 





口 ， 向 其 中 添加 菜单 和 工具 栏 ， 设 置 其 大 小 ， 将 它 放 置 在 屏幕 中 央 ， 组 装 构成 用 户 
界面 的 构件 。 注 意 ， 这 个 函数 并 未 在 屏幕 上 显示 窗口 ， 而 是 返回 一 个 指向 窗口 的 指针 。 

GtkWidget * create main window|) 

€ 





GtkWidget *toolbar; 
GtkWidget *vbox; 
GtkWidget *hbox; 
GtkWidget *label; 
GtkWidget *entry; 
GtkWidget *search button; 
GtkWidget *scrolledwindow; 
GtkCellRenderer *renderer; 


app = gnome app new ("GnomeCD", *CD Database"); 


gtk window set position ( GTK WINDOW( app), GTK WIN POS CENTER]; 
gtk window set default size ( GTK WINDOW( app ), 540, 480); 


gnome app.create menus (GNOME APP (app), menubar); 


(6) 使 用 GTK+ 自 带 的 图 标 来 创建 工具 栏 ， 并 连接 回调 函数 : 


toolbar = gtk toolbar new (); 
gnome app add toolbar (GNOME APP (app), GTK TOOLBAR (toolbar), "toolbar", 
BONOBO DOCK ITEM BEH EXCLUSIVE, 
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BONOBO DOCK TOP, 1, 0, 0); 
gtk container set border width (GTK CONTAINER (toolbar), 1); 
gtk toolbar insert stock (GTK TOOLBAR (toolbar), 
"gtk-add*, 
"Add new CD", 
NULL, GTK SIGNAL FUNC (on addcd activate), 
NULL, -1); 
gtk toolbar insert space (GTK TOOLBAR (toolbar), 1); 
gtk toolbar insert stock (GTK TOOLBAR (toolbar), 
*gtk-quit*, 
"Quit the Application*, 
NULL, GTK SIGNAL FUNC (on quit activate), 
NULL, -1); 


(7) 创建 用 于 搜索 CD 的 构件 : 


label = gtk_label_new("Search String: 
entry = gtk entry new (); 
search button = gtk button new with, label('Search'); 


(8) gtk_scrolled_window 提 供 滚动 条 ， 使 构件 〈 在 本 例 中 是 ctkTreeview) 可 以 扩展 超出 窗口 
的 大 小 ; 


Scrolledwindow = gtk scrolled window new (NULL, NULL) 
gtk scrolled window set policy (GTK SCROLLED WINDOW 
GTK, POLICY AUTOMATIC, 
GTK. POLICY AUTOMATIC); 


(9) 接 下 来 ， 像 通常 那样 用 容器 构件 来 排列 界面 元 


vbox = gtk vbox new (FALSE, 0); 

hbox - gtk hbox new (FALSE, 0); 

gtk box pack start (GTK BOX (vbox), hbox, FALSE, FALSE, 5); 

gtk box pack start (GTK BOX (hbox), label, FALSE, FALSE, 5); 
gtk.box pack start (GTK BOX (hbox), entry, TRUE, TRUE, 6); 
gtk.box pack start (GTK BOX (hbox), search button, FALSE, FALSE, 5); 
gtk box pack start (GTK BOX (vbox), scrolledwindow, TRUE, TRUE, 0); 


(10) 然后 创建 GtkTreeview 构 件 ， 增 加 3 列 ， 并 将 其 放 在 Gtkscrolleawindow 中 : 


treeview = gtk_tree_view_new(); 
renderer = gtk cell renderer text new (); 
gtk tree view insert column with attributes (GTK TREE VIEW(treeview), 











rolledwindow), 








NULL); 

gtk tree view insert column with attributes (GTK TREE VIEW(treeview), 
COLUMN ARTIST, 
"Artist', renderer, 
"text", COLUMN ARTIST, 
NULL); 

gtk tree view insert column with attributes (GTK TREE VIEW(treeview), 
COLUMN, CATALOGUE, 
"Catalogue*, renderer, 
"text, COLUMN CATALOGUE, 
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NULL); 


gtk tree view set search column (GTK TREE VIEW (treeview), 
COLUMN TITLE); 


gtk container add (GTK CONTAINER (scrolledwindow), treeview); 
(1) 最 后 ， 设 定 主 窗口 的 内 容 ， 增 加 一 个 GnomeAppbar， 并 连接 必要 的 回调 函数 : 


gnome app set contents (GNOME APP (app), vbox); 


appbar = gnome appbar new (FALSE, TRUE, GNOME PREFERENCES NEVER); 
gnome app set statusbar (GNOME APP (app), appbar); 


gnome app install menu hints (GNOME APP (app), menubar); 


g.signal connect (GTK OBJECT (search button), "clicked", 
GTK SIGNAL FUNC (on search button clicked), 
entry); 


g.signal connect (GTK OBJECT(app), 'delete event*, 
GTK SIGNAL FUNC ( delete event handler ), 
NULL); 


g.signal connect (GTK OBJECT(app), "destroy", 
GTK SIGNAL FUNC ( quit app ), NULL); 


return app; 
Y 


(12) 下 面 的 函数 创建 了 一 个 简单 的 对 话 框 ， 用 来 向 数据 库 中 添加 一 张 新 的 CD.。 它 包括 艺术 家 、 标 


题 和 类 别 的 输入 框 ， 以 及 OK 和 Cancel 按 钮 : 


GtkWidget *create addcd dialog() 
d 
artist entry = gtk entry new(); 
title entry = gtk entry new(); 
catalogue entry - gtk entry new(); 





GtkWidget *dialog = gtk dialog new with buttons ('Add CD", 


app, 
GTK DIALOG DESTROY, WITH PARENT, 


GTK. STOCK. OK, 
GTK RESPONSE, ACCEPT, 
GTK. STOCK CANCEL, 
GTK RESPONSE REJECT, 
NULL); 
add widget with label ( GTK CONTAINER (GTK DIALOG (dialog)-»vbox), 
"Artist", artist entry); 
add widget with label ( GTK CONTAINER (GTK DIALOG (dialog)-»vbox), 
"Title", title entry); 


add widget with label ( GTK CONTAINER (GTK DIALOG (dialog) AN 
"Catalogue*, catalogue entry); 
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g.signal connect ( GTK OBJECT (dialog), "response", 
GTK SIGNAL FUNC (addcd dialog button clicked), NULL); 


return dialog; 


) 


(13) 用 户 在 查询 数据 库 之 前 需要 先 登 录 数 据 库 。 下 面 这 个 函数 创建 一 个 对 话 框 ， 用 于 输入 用 户 名 
和 密码 : 


GtkWidget *create_login_dialog() 
t 
GtkWidget *dialog = gtk dialog new with buttons ("Database Login", 

app. 
GTK. DIALOG. MODAL, 
GTK STOCK OK, 
GTK RESPONSE ACCEPT, 
GTK. STOCK, CANCEL, 
GTK RESPONSE REJECT, 
NULL); 


username entry = gtk entry new(); 
password entry = gtk entry new); 


gtk entry set visibility(GTK ENTRY (password entry), FALSE); 

add widget with label ( GTK CONTAINER (GTK DIALOG (dialog)-»vbox) , "Username", 
username entry); 

add widget with label ( GTK CONTAINER (GTK DIALOG (dialog)-»vbox) , "Password", 
password entry); 

gtk widget show all(GTK WIDGET (GTK DIALOG (dialog)-»vbox)]; 


return dialog; 
Y 


TERT caiiracks.c 


文件 callbacks.c 包 含 用 于 UI 构 件 的 回调 函数 定义 。 
(D 首先 ， 需 要 包含 头 文件 和 引用 一 些 在 incerface.c 中 定义 的 全 局 变量 ， 这 样 你 就 可 以 读 取 和 更 
改革 些 构件 的 属性 了 : 


#include "app gnome.h* 





extern GtkWidget *treeview; 
extern GtkWidget *app; 

extern GtkWidget *appbar; 

extern GtkWidget *artist entry; 
extern GtkWidget *title entry; 
extern GtkWidget *catalogue entry; 


static GtkWidget *addcd dialog; 
(2) 在 auit_app 中 ， 调 用 aatabase_end 在 退出 前 做 清理 工作 并 关闭 数据 库 : 
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void quit app( GtkWidget *window, gpointer data) 
t 

database end(); 

gtk main quit(); 
1 


(3) 接 下 来 的 函数 弹出 一 个 简单 的 对 话 框 ， 用 于 确认 你 是 否 想 要 退出 应 用 程序 ， 并 返回 一 个 
gboolean 类 型 的 响应 : 


gboolean confirm exit() 
€ 
gint result; 
GtkWidget *dialog = gtk message dialog new (NULL, 
GTK. DIALOG MODAL, 
GTK. MESSAGE, QUESTION, 
GTK. BUTTONS. YES. NO, 
"Are you sure you want to quit?"); 


result = gtk dialog run (GTK DIALOG (dialog]); 
gtk widget destroy (dialog); 


return (result == GTK RESPONSE YES); 

) 

(4) aeleke_event_handler 是 一 个 与 主 窗口 的 Gak 删 除 事件 相连 接 的 回调 函数 。 这 个 事件 在 你 试 
图 关闭 窗口 时 发 送 ， 但 它 位 于 GTK+ destroy 信 号 发 出 之 前 。 

gboolean delete event handler ( GtkWidget *window, GdkEvent *event, gpointer data) 


( 
return !confirm exit(); 





) 


(5) 下 一 个 函数 在 用 户 点 击 增加 CD 对 话 框 中 的 按钮 时 被 调用 。 如 果 点 击 了 OK 按钮 ， 程 序 将 字符 串 
复制 到 一 个 非 const 的 字符 数组 中 ， 并 将 其 中 的 数据 传递 给 MySQL 的 接口 函数 aad_cd; 


void addcd dialog button clicked (GtkDialog * dialog, gint response, 
gpointer userdata) 
{ 
const gchar *artist const; 
const gchar *title const; 
const gchar *catalogue const; 
gchar artist[200]; 
gchar title[200]; 
gchar catalogue[200]; 
gint *cà id; 


if (response -- GTK RESPONSE ACCEPT) 

t 
artist const = gtk entry get text(GTK ENTRY (artist entry)):; 
title const = gtk entry get text(GTK ENTRY (title entry)); 
catalogue const = gtk entry get text(GTK ENTRY (catalogue entry)); 





strcpy(artist, artist const); 
strcpy(title, title const); 
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strcpy(catalogue, catalogue const); 


add cd(artist, title, catalogue, cd id); 
} 


addcd dialog = NULL; 
gtk widget destroy(GTK WIDGET (dialog) ); 
Y 


(6) 这 是 整个 应 用 程序 的 核心 部 分 ， 获取 搜索 结果 ， 并 填充 Gtkrreeview。 


void on search button clicked (GtkButton *button, gpointer userdata) 
t 
struct cd search st cd res; 
struct current. cd st cd; 
struct current. tracks st ct; 
gint resl, res2, rei 
gchar track title[110]; 
const gchar *search string const; 
gchar search string[200]; 
gchar search text [200]; 
gint i = 0, j = 0; 





GtkTreeStore *tree_store; 
GtkTreeIter parent_iter, child_iter; 


memset(&track title, 0, sizeof(track title)); 
(7) 你 从 输入 框 构件 中 得 到 搜索 字符 串 ， 将 其 复制 到 一 个 非 const 的 变量 中 ， 然 后 获取 匹配 CD 的 
ID: 


Search string const = gtk entry get text(GTK ENTRY (userdata)); 
strcpy (search string, search string const); 
resl = find cds(search string, &cd res); 


(8) 接着 ， 更 新 appbar 来 显示 一 条 消息 ， 通 知 用 户 搜索 结果 


sprintf(search text, * Displaying %d result(s) for search string ' s '', 
MIN(resl, MAX CD RESULT), search string); 
gnome appbar push (GNOME APPBAR( appbar), search text); 

(9) 现在 你 得 到 了 搜索 结果 ， 可 以 用 它 来 填充 GtkTreescore 了 。 对 每 个 CD ID， 你 需要 获取 其 
对 应 的 current_ca_st 结 构 ( 这 个 结构 包含 了 CD 的 标题 和 作曲 家 信息 ), 然后 获取 其 曲目 列表 。 还 
要 限制 CD 条 目的 总 数 不 超 过 app_mysql .h 中 定义 的 MAX_cD_REsULT 值 , 来 确保 GtkTreestore 不 
会 溢出 。 


tree store = gtk tree store new (N COLUMNS, 





while (i « resi && i « MAX CD RESULT) 
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res2 = get cd(cd res.cd id[i], &cd); 


/* Add a new row to the model */ 
gtk tree store append (tree store, &parent iter, NULL); 
gtk tree store set (tree store, &parent iter, 
COLUMN TITLE, cd.title, 
COLUMN ARTIST, cd.artist name, 
COLUMN CATALOGUE, cd.catalogue, -1 
) 


res3 = get cd tracks(cd res.cd id[i««], &ct); 

j= 0; 

/* Populate the tree with the current cd's tracks */ 
while (j < res3) 

{ 


sprintf(track title, " Track %d. *, j+1); 
Strcat(track title, ct.track[je*]); 


gtk tree store append (tree store, &child iter, &parent iter); 
gtk tree store set (tree store, &child iter, 
COLUMN TITLE, track title, -1); 
Y 
) 
gtk tree view set model (GTK TREE VIEW (treeview), GTK TREE MODEL [tree store)); 

) 
(10) adqdacd 对 话 框 是 非 模式 的 。 因 此 ， 你 需要 在 创建 和 显示 它 之 前 先 检查 它 是 否 已 存在 : 


void on addcd activate (GtkMenuItem * menuitem, gpointer user data) 
t 





if (addcd dialog != NULL) 
return; 


addcd dialog = create addcd dialog(); 
gtk widget show all (addcd dialog); 





) 
gboolean close app ( GtkWidget * window, gpointer data) 
: gboolean exit; 

if ((exit = confirm exit())) 

: quit app(NULL, NULL); 


return exit; 
) 


(11) 当 点 击 About 按 钮 时 ， 一 个 标准 的 GNOME about CX TO. 窗口 将 弹出 : 
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void on about activate (GtkMenuItem * menuitem, gpointer user data) 


{ 

const char * authors[] = ("Wrox Press*, NULL); 

GtkWidget *about = gnome about new ("CD Database", *1.0*, 
"(c) Wrox Press", 
"Beginning Linux Programming", 
(const char ** ) authors, NULL, 
"Translators*, NULL); 

gtk widget show(about); 


Www , main.c 


输入 下 面 代码 ， 将 它 命名 为 main.c， 它 包含 这 个 程序 的 main 函 数 。 
(D 在 include 语 句 之 后 ， 你 引用 在 interface.c 中 定义 的 用 户 名 和 密码 输入 构件 


#include <stdio.h> 
#include <stdlib.h> 





#include "app_gnome.h" 


extern GtkWidget *username_entry; 
extern GtkWidget *password entry; 


gint main(gint argc, gchar *argv[]) 


GtkWidget *main_window; 
GtkWidget *login_dialog; 
const char *user_const; 
const char *pass_const; 
gchar username[100]; 
gchar password[100]; 
gint result; 


(2) 像 通 常 一 样 初始 化 GNOME 库 ， 然 后 创建 并 显示 主 窗口 和 登录 对 话 框 : 


gnome program init ("CdDatabase", *0.1*, LIBGNOMEUI MODULE, 
argc, argv, 
GNOME PARAM APP DATADIR, '*, 
NULL); 

main window = create main window(); 

gtk widget, show a11(main window); 





login dialog = create login dialog(); 


(3) 程序 不 断 循 环 , 直到 用 户 输入 了 一 个 正确 的 用 户 名 和 密码 。 用 户 可 以 通过 点 击 Cancel 按 钮 退出 ， 
此 时 程序 会 询问 他 是 否 确认 这 个 操作 。 


while (1) 


result = gtk dialog run (GTK DIALOG (login dialog)); 
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if (result !- GTK RESPONSE ACCEPT) 
t 
if (confirm exit(]) 
return 0; 
else 
continue; 
) 
user const = gtk entry get text(GTK ENTRY (username entry)); 
pass const = gtk entry get text(GTK ENTRY (password entry)); 
strcpy(username, user const); 
strcpy(password, pass const]; 


if (database start(username, password) == TRUE) 
break; 


将 显示 一 条 错误 信息 ， 并 重新 显示 登录 对 话 框 : 


GtkWidget * error dialog = gtk message dialog new (GTK_WINDOW (main_window), 
GTK DIALOG DESTROY WITH PARENT, 
GTK MESSAGE ERROR, 
GTK BUTTONS CLOSE, 
"Could not log on! - Check Username and Password"); 

gtk dialog run (GTK DIALOG (error dialog); 

gtk widget destroy (error dialog); 

Y 


(4) 如 果 database_start 失 败 ， 








gtk widget destroy (login dialog); 
gtk main(); 


return 0; 
) 


(5) 你 将 编写 一 个 makefile 文 件 来 编译 这 个 应 用 程序 . 和 第 8 章 中 一 样 , 你 可 能 需要 添加 mysqlclient 
库 的 路 径 ， 如 下 所 示 : 

-L/usr/lib/mysql 

在 -LI 之 后 指定 你 的 系统 中 放置 MySQL 库 的 目录 。 


all: app 


app: appomysql.c callbacks.c interface.c main.c app gnome.h app mysql.h 
gcc -o app -I/usr/include/mysql app mysql.c callbacks.c interface.c main.c ~ 
lmysqlclient "pkg-config --cflags --libs libgnome-2.0 libgnomeui-2.0" 





clean: 
rm -f app 
(6) 现在 只 需 使 用 make 命 令 来 编译 这 个 CD 应 用 程序 即 可 : 
make -f Makefile 
运行 app， 你 将 会 看 到 一 个 GNOME 风 格 的 CD 应 用 程序 (如 图 16-15)。 
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16.10 ”小结 


在 本 章 中 ， 你 学 习 了 如 何 用 GTK+/GNOME 库 来 编写 具有 专业 界面 外 观 的 GUI 应 用 程序 。 首先,， 你 
了 解 了 X 视 窗 系统 以 及 工具 包 是 如 何 与 之 相 适应 的 ， 然 后 简要 了 解 了 GTK+ 及 其 对 象 系统 和 信号 /回调 
函数 机 制 是 如 何 运作 的 。 

接着 ,你 开始 学 习 GTK+ 构 件 的 API 函 数 , 我 们 通过 一 些 程序 展示 了 其 或 简单 或 高 级 的 实际 使 用 情 
况 。 在 学 习 GnomeApp 构 件 时 ， 你 看 到 通过 辅助 宏 创建 菜单 是 多 么 容易 。 最 后 ， 你 学 习 了 如 何 创建 模式 
和 非 模式 对 话 框 来 与 用 户 进行 交互 。 

在 本 章 的 最 后 ， 你 为 CD 数据 库 创建 了 一 个 GNOME/GTK+ 的 GUI， 你 可 以 通过 它 登 录 数 据 库 、 搜 
索 CD， 以 及 向 数据 库 中 增加 CD。 

在 第 17 章 中 ， 你 将 看 到 GTK+ 的 竞争 者 Qt， 并 学 习 如 何 使 用 Qt 来 编写 KDE 程 序 。 





学 习 这 些 库 ， 并 看 到 





第 17 章 
用 Qt 进行 KDE 编 程 





第 16 章 中 ， 你 学 习 了 在 X 环 境 下 使 用 GNOME/GTK+ GUI 库 来 创建 图 形 用 户 界面 。 但 并 非 只 
CE 能 使 用 那些 来 开发 GUI，Linux 的 GUI 领域 中 的 另 一 大 主角 是 KDE/Qt。 在 本 章 中 ， 你 将 会 
> 们 是 怎样 在 与 GNOME/GTK+ 的 竞争 中 发 展 的 。 
编写 的 ，C++ 也 是 编写 QUKDE 程 序 的 标准 语言 。 因 此 在 本 章 中 ， 你 必须 把 注意 力 








Qt 是 用 C+ 


从 你 熟悉 的 C 语 言 转移 到 C++ 语 言 上 来 。 你 也 可 借 此 机 会 重 温 一 下 C++ 语 言 ,特别 是 回顾 一 下 派生 、 封 


装 、 


方法 重 载 和 虚 函 数 的 基本 原理 。 

本 章 我 们 将 介绍 以 下 内 容 : 

口 Qt 简介 

口 安装 Qt 

口 开始 编程 

a (smt 

口 Qt 构件 

O Qt 对 话 框 

口 KDE 环 境 下 的 菜单 和 工具 栏 

口 使 用 KDE/Qt 创 建 CD 数 据 库 应 用 程序 





17.1 KDE 和 Qt 简介 


KDE CK ED. 是 一 个 基于 Qt GUI 库 的 开源 桌面 环境 。KDE 中 包含 了 大 量 的 应 用 程序 和 工具 ， 


其 中 包括 一 整套 办 公 套 件 、 一 个 Web 浏 览 器 ， 甚 至 还 有 一 个 功能 齐全 的 KDE/Qt 应 用 程序 集成 开发 环境 
〈 即 在 第 9 章 中 介绍 的 KDevelop)。 当 苹果 公司 选用 KDE 的 Web 浏 览 器 作为 Mac OS X 的 主要 Web 浏 览 器 
Safari 〈 被 认为 是 最 快速 的 浏览 器 ) 的 核心 时 ， 业 界 才 发 现 KDE 的 程序 有 多 先进 。 


序 、 


KDE 项 目的 主页 是 http://www.kde.org， 在 那里 你 可 以 了 解 它 的 更 多 信息 、 下 载 KDE 和 KDE 应 用 程 
查找 文档 、 加 入 邮件 列表 ， 以 及 了 解 其 他 开发 者 的 信息 。 

在 写作 本 书 时 ，KDE 的 最 新 版 本 是 3.5.7。 因 为 这 是 当前 Linux 发 行 版 自 带 的 版 本 ， 所 以 
我 们 将 假设 你 已 经 安装 了 KDE 3.5 或 者 更 高 的 版 本 。 目 前， 开发 人 员 正 在 开发 KDE 的 一 个 主 
要 升级 版 本 KDE 4.0. 你 也 可 以 下 载 KDE 4.0 的 预览 版 . 同样 地 ，Qt 的 最 新 版 本 是 4.3， 但 大 多 
数 Linux 发 行 版 自 带 的 版 本 是 Qt3， 如 Qt 3.3。 本 章 将 介绍 QT3.3， 因 为 它 是 目前 最 常见 的 一 个 
版 本 . 


从 程序 员 的 角度 来 看 ，KDE 提 供 了 许多 KDE 构 件 ， 这 些 构件 通常 来 源 于 伴随 它们 的 Qt， 但 相 比 功 
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能 增强 了 并 且 也 更 易 使 用 了 。 与 单独 使 用 Qt 相 比 ， KDE 构件 提供 了 与 KDE 桌 面 更 好 的 集成 。 例 如 ， 你 
可 以 进行 会 话 管理 。 

Qt 是 一 个 用 C++ 编写 的 、 成 熟 的 、 跨 平台 的 GUI 工具 包 。 它 是 挪威 Trolltech 公 司 的 产品 ， 该 公司 为 
商业 市 场 开 发 、 销 售 和 支持 Qt 及 Qt 相关 软件 。Trolltech 着 力 大 律 宣传 Qt 的 跨 平台 能 力 ， 这 个 能 力 的 确 
令 人 印象 深刻 。Qt 本 身 就 支持 Linux 和 类 UNIX 系 统 、Windows、Mac OS X， 甚 至 嵌入 式 平台 ， 这 是 Qt 
相 比 其 竞争 对 手 的 一 大 竞争 优势 。 

Qt 有 一 个 可 以 在 手机 上 运行 的 专用 版 本 。 它 的 另 一 个 版 本 可 以 运行 在 Sharp Zaurus PDA 

和 类 似 的 平台 上 。 Qt Jambi 还 提供 了 该 工具 包 的 一 个 Java 版 本 。 


Trolltech 公 司 目前 以 一 个 对 临时 用 户 和 爱好 者 来 说 非常 高 的 价格 在 销售 Qt 的 商业 版 本 。 但 值得 庆幸 
的 是 , Trolltech 公 司 意识 到 了 为 自由 软件 社区 提供 一 个 免费 版 本 的 价值 因此, 它 提供 了 一 个 支持 Linux、 
Windows 和 Mac OS X 的 Qt 开源 版 本 。 为 此 ，Trolltech 公 司 也 赢得 了 一 个 庞大 的 用 户 群 、 一 个 大 型 的 程序 
员 社 区 和 对 其 产品 的 高 度 认 可 。 

Qt 开源 版 本 遵循 GPL 许可 证 ， 这 意味 着 你 可 以 用 Qt 库 编写 程序 ， 并 且 免 费 发 布 自己 的 GPL 软件 。 据 
我 们 所 知 ，Qt 开 源 版 本 与 Qt 专业 版 本 之 间 的 两 个 主要 EE 前 者 缺乏 支持 以 及 你 不 能 在 商业 应 用 程 
序 中 使 用 Qt 软件 。Trolltech 的 网 站 http://www.trolltech.com 上 有 你 需要 的 所 有 API 文 档 。 


17.2 安装 Qt 


除非 你 有 特殊 的 原因 需要 从 源 代码 开始 编译 ， 否 则 最 好 直接 找 一 个 针对 你 的 Linux 发 行 版 的 二 进 
制 软件 包 或 RPM 包 来 安装 Qt。Fedora Linux 7 自 带 了 at-3.3.8-4.i386.rpm， 你 可 以 用 下 面 的 命令 来 

$ rpm -Uvh qt-3.3.8-4.1386.rpm 

你 也 可 以 用 软件 包 管 理 器 来 安装 Qt 和 KDE 编 程 库 〈 见 图 17-1)。 


CURR- C E 











Be Ye Be 
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如 果 想 自己 下 载 源 代码 并 编译 Qt， 你 可 以 从 Trolltech 公 司 的 FTP 站 点 fp:/ftp.trolltech.coryqtsource/ 下 载 
最 新 的 源 代码 包 。tar 软 件 包 中 的 INSTALL 文 件 详细 说 明了 如 何 编译 和 安装 Qt: 

$ cd /usr/local 

$ tar -xvzf qt-xll-free-3.3.8.tar.gz 

$ ./configure 

$ make 


你 还 需要 在 /etc/1d.so.conf 文 件 中 添加 如 下 一 行 〈 该 行 可 以 添加 在 这 个 文件 中 的 任何 位 置 ) ， 
/usr/lib/qt-3.3/1lib 

在 Fedora 和 Red Hat Linux 系 统 中 ， 这 行内 容 是 保存 在 文件 /etc/1d.so.conf.d/qt- 
i386.conf. 中 的 。 如 果 你 是 按 轩 17-1 所 示 的 方式 安装 的 Qt， 那 么 这 一 步骤 可 以 省 略 ， 因 为 系 
统 已 经 帮 你 做 好 了 。 
在 安装 好 Qt 后 ， 环 境 变量 oTDIR 应 被 设置 为 Qt 的 安装 目录 。 你 可 以 用 如 下 命令 进行 检查 : 


$ echo $QTDIR 
/usr/lib/qt-3.3 


同时 ， 要 确认 lib 目 录 已 被 添加 到 /etc/1d.so.conf 文 件 中 。 

接 下 来 以 超级 用 户 的 身份 运行 如 下 命令 : 

# ldconfig 

你 先 尝试 运行 下 面 这 个 最 简单 的 Qt 程序 ， 以 确保 你 的 Qt 安装 能 够 正常 工作 。 





实 验 omainwindow 
输入 这 个 程序 或 对 下 载 的 代码 进行 复制 、 粘 贴 )， 将 其 命名 为 qt1 .cpp: 


#include <qapplication.h> 
#include «qmainwindow.h» 


int main(int argc, char **argv) 


QApplication app(argc, argv); 
QMainWindow *window = new QMainWindow(); 


app.setMainWidget (window); 
window-»show(); 


return app.exec(); 
A 


要 编译 这 个 程序 ， 你 需要 包含 Qt 的 include 和 1ib 目 录 : 
$ g++ -o qtl qtl.cpp -I$QTDIR/include -L$QTDIR/lib -lqui 
在 某 些 平台 上 ， 上 面 命令 最 后 的 库 是 -lqt。 不 过 对 Qt3.3 来 说 , 应 
使 用 -lqui. 
运行 这 个 程序 ， 你 将 看 到 一 个 Qt 窗口 〈 见 图 17-2)。 
$ ./qti 
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与 GTK+ 不 同 ，Qt 中 没有 一 个 涵盖 一 切 的 at .hn 头 文件 ， 因 此 你 必须 明确 包含 对 应 每 个 你 所 使 用 对 
象 的 头 文件 。 

你 遇 到 的 第 一 个 对 象 是 oappl icarion。 这 是 必须 构造 的 主 Qt 对 象 ， 你 将 命令 行 参数 传递 给 它 。 每 
个 Qt 应 用 程序 必须 有 且 仅 有 一 个 Qapplication 对 象 ， 而 且 你 必须 在 做 其 他 任何 事 之 前 创建 它 。 
QApplication 负 责 处 理 一 些 底层 操作 ， 如 事件 处 理 、 字 符 串 本 地 化 和 控制 界面 外 观 等 。 

上 述 使 用 了 两 个 QApplication 的 方法 : 一 个 是 setMainwiaget， 它 设置 应 用 程序 的 主 构件 ; 
另 一 个 是 exec， 它 启动 事件 循环 。exec 将 一 直 运行 ， 直 到 QApplication: :quit () 被 调用 或 主 构件 被 
关闭 。 

oOMainwindow 是 一 个 Qt 基础 窗口 构件 ， 它 支持 菜单 、 工 具 栏 和 状态 栏 。 本 章 会 详细 讲述 如 何 扩展 
它 ， 以 及 为 其 添加 构件 以 创建 一 个 用 户 界面 。 
接 下 来 ， 我 们 将 介绍 事件 驱动 编程 的 机 制 ， 你 将 为 应 用 程序 添加 一 个 PushButton 构 件 。 





17.3 ”信和 号 和 槽 


正如 你 在 第 16 章 中 所 看 到 的 ， 信 号 和 信号 处 理 是 GUI 应 用 程序 用 来 响应 用 户 输入 的 主要 机 制 ， 也 
是 所 有 GUI 库 的 核心 特征 。Qt 的 信号 处 理 机 制 由 信号 (signal》 和 检 (slot) 构成 ， 它 们 相当 于 GTK+ 
中 的 信号 和 回调 函数 ， 或 者 Java 中 的 事件 和 事件 句柄 。 

注意 ，Qt 信 号 与 第 11 章 中 讨论 的 UNIX 信 号 是 完全 不 同 的 两 个 概念 。 

这 里 再 回顾 一 下 事件 驱动 编程 的 原理 : 一 个 GUI 是 由 菜单 、 工 具 栏 、 按 钮 、 输入 框 和 许多 其 他 GUI 
元 素 组 成 的 ， 这 些 元 素 被 统称 为 构件 。 当 用 户 与 一 个 构件 交互 时 ， 例 如 激活 菜单 项 或 者 在 输入 框 中 输 
入 一 些 文本 ， 构 件 将 发 出 一 个 命名 信号 ， 如 clickeG、text_changed 或 key_pressed。 你 通常 要 对 用 
户 的 动作 做 出 响应 ， 例 如 保存 一 个 文档 或 退出 应 用 程序 。 你 通过 把 一 个 信号 连接 到 一 个 回调 函数 〈 在 
Qt 的 说 法 中 ， 是 一 个 档 ) 来 做 到 这 一 点 。 

在 Qt 中 使 用 信号 和 档 的 方法 比较 特别 ，Qt 定 义 了 两 个 新 的 很 贴切 的 伪 关 键 字 〈signals 和 
和 槽 。 这 非常 有 利于 增强 代码 的 可 读 性 和 可 维 
性 ， 但 它 也 意味 着 ， 代 码 必须 经 过 一 个 单独 的 预 一 预 处 理 阶段 (pre-pre processing)， 来 搜索 这 些 
人 擅 关键 字 并 用 额外 的 C++ 代码 对 它们 进行 替换 。 

因此 ，Qt 代 码 并 不 是 真正 的 C++ 代码 。 这 有 时 候 对 某 些 开发 人 员 来 说 是 一 个 问题 。 

http://doc.trolltech.com/ 上 的 Qt 文档 中 包含 了 使 用 这 些 新 的 伪 C++ 关 键 字 的 原因 。 此 外 ， 信 和 号 

和 模 的 使 用 与 Windows 中 的 微软 基础 类 或 MFC 并 没有 什么 不 同 ， 后 者 也 使 用 了 一 个 C++ 语言 

的 修改 定义 。 

Qt 中 信号 和 槽 的 使 用 有 一 些 限 制 ， 但 这 些 限制 不 是 太 严重 。 

口 信号 和 槽 必须 是 cobject 的 派生 类 的 成 员 函 数 。 

O 如 果 使 用 多 重 继承 ，oobject 必 须 在 类 列表 中 第 一 个 出 现 。 

O 在 类 声明 中 必须 出 现 Q_oBJEcT 语 句 。 

O 信号 不 能 在 模板 中 使 用 。 

O 函数 指针 不 能 用 作 信号 和 槽 的 参数 。 

O 信号 和 槽 不 能 被 覆 写 和 提升 为 公共 (public) 方法 。 
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因为 你 需要 在 object 的 派生 类 中 编写 信号 和 槽 ,而 且 Qt 基 础 构件 widget 派生 自 cobject, 所 以 


通过 扩展 和 定制 构件 来 创建 界面 是 合情合理 的 。 在 Qt 中 ， 你 几乎 都 是 通过 扩展 如 QMainwindow 这 样 的 
构件 来 创建 界面 。 


一 个 典型 的 针对 GUI 的 类 定义 Mywindow.h 如 下 所 示 : 


class MyWindow : public QMainWindow 
t 





Q OBJECT 
public: 

MyWindow(); 

virtual -MyWindow(); 
signals: 

void aSignal(); 


private slots: 
void doSomething(); 
) 


该 类 继承 自 cMainwindow， 它 为 应 用 程序 中 的 主 窗口 提供 功能 。 类 似 地 ， 当 需要 一 个 对 话 框 时 ， 
你 将 创建 一 个 opialog 的 子 类 。 类 声明 的 第 一 条 语句 是 Q_oBJECT， 它 充当 一 个 预 处 理 器 标记 ， 接 下 来 
就 是 通常 的 构造 函数 和 析 构 函数 原型 ， 然 后 是 信号 和 槽 的 定义 。 

你 有 一 个 信号 和 一 个 槽 ， 二 者 均 无 参数 。 要 发 出 一 个 信号 ， 你 只 需 在 代码 的 某 处 调用 emit: 

emit aSignal(); 


也 就 是 说 ， 其 他 的 所 有 事情 都 是 由 Qt 来 处 理 ， 你 甚至 不 需要 提供 一 个 asignal O 的 实现 。 
要 使 用 模 ， 你 必须 将 它们 连接 到 一 个 信号 。 这 是 通过 oobject 类 中 的 静态 方法 connect 来 完成 的 ; 
bool Qobject: :connect (const QObject * sender, const char * signal, 
const QObject * receiver, const char * member) 
你 只 需 传递 4 个 参数 : 拥有 信号 的 对 象 (发送 者 )、 信 号 函数 、 拥 有 梢 的 对 象 〈 接 收 者 )、 档 的 名 字 。 
在 上 面 的 ywindow 例 子 中 ， 如 果 想 把 opushBucton 构 件 的 clicked 信 号 连接 到 dosomerhing 模 ， 
你 可 以 这 样 写 ; 
connect (button, SIGNAL(clicked()), this, SLOT(doSomething())); 
注意 ， 你 必须 用 SIGNAL 和 SLoT 宏 来 包围 信号 和 槽 函数。 与 GTK+ 类 似 ， 一 个 给 定 信号 可 以 连接 任 
意 数目 的 档 ， 一 个 档 也 可 以 连接 任意 数目 的 信号 ， 只 要 多 次 调用 connect 方 法 即 可 。 如 果 连 接 失败 ， 
它 将 返回 FALSE。 
剩 下 的 事 就 是 实现 槽 函数 ， 它 采用 的 是 一 个 普通 成 员 函 数 的 形式 : 


void MyWindow: :đoSomething () 
t 


) 


实验 信号 和 槽 


你 已 经 了 解 了 信号 和 槽 的 工作 原理 ， 现 在 通过 一 个 例子 来 使 用 它们 。 扩 展 QMainwinaow 并 增加 一 
个 按钮 ， 然 后 把 按钮 的 clickead 信 号 连接 到 一 个 槽 。 
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(D 输入 下 面 的 类 声明 ， 把 它 命名 为 Buttonwindow.h: 


#include <qmainwindow.h> 


class ButtonWindow : public QMainWindow 
{ 
Q_OBJECT 


public: 
ButtonWindow(QWidget *parent = 0, const char *name = 0); 
virtual -ButtoniWindow(); 


private slots: 
void Clicked(); 
J 
(2) 接 下 来 是 类 的 实现 ButtonWindow. cpp: 


#include "ButtonWindow.moc" 
#include «qpushbutton.h» 
#include <qapplication.h> 
#include <iostream> 


(3) 在 构造 函数 中 , 你 设置 窗口 标题 , 创建 按钮 , 并 且 把 按钮 的 cl ickea 信 号 连接 到 档 。setcaption 
是 QMainwinaow 中 设置 窗口 标题 的 方 当 


ButtonWindow::ButtonWindow(QWidget *parent, const char *name) 
: QMainWindow(parent, name) 





t 
this-»setCaption("This is the window Title"); 
QPushButton *button = new QPushButton(*Click Me!*, this, "Buttonl*); 
button-»setGeometry(50,30,70,20); 
connect (button, SIGNAL(clicked()), this, SLOT(Clicked())); 
) 


(4) Qt 自动 管理 构件 的 析 构 函数 ， 所 以 你 的 析 构 函数 是 空 的 : 


ButtonWindow: :-ButtonWindow|) 


) 
(5) 接 下 来 是 槽 的 实现 代码 : 


void ButtonWindow: :Clicked(void) 
t 

std::cout << "clicked!Wn'; 
* 


(6) 最 后 ， 在 main 函 数 中 ， 你 只 创建 了 Buttonwindow 的 一 个 实例 ， 把 它 设置 成 应 用 程序 的 主 窗 
口 ， 然 后 在 屏幕 上 显示 它 : 


int main(int argc, char **argv) 
C 
QApplication app(argc,argv); 
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ButtonWindow *window = new ButtonWindow(); 


app.setMainWidget (window) ; 
window-»show(); 


return app.exec(); 
) 


(7) 在 编译 这 个 例子 之 前 ， 你 需要 对 头 文件 运行 预 处 理 程序 。 这 个 预 处 理 程序 被 称 为 元 对 象 编译 
器 (moc), 它 位 于 Qt 软件 包 中 ,在 Buttonwindow.h 上 运行 moc, 将 输出 结果 保存 为 Buttonwindow.moc: 
$ moc ButtonWindow.h -o ButtonWindow.moc 
现在 你 可 以 像 往常 那样 编译 程序 了 ， 将 moc 的 输出 链接 进来 : 
$ g++ -o button ButtonWindow.cpp -I$QTDIR/include -L$QTDIR/lib -1qui 
运行 该 程序 ， 你 将 看 到 如 图 17-3 所 示 的 内 容 。 
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图 173 


我 们 在 这 里 引入 了 一 个 新 的 构件 和 一 些 新 函数 ， 下 面 就 对 它们 分 别 进行 介绍 。QPushButton 是 一 
个 简单 的 按钮 构件 ， 它 有 一 个 标签 和 位 图 ， 用 户 可 以 通过 使 用 鼠标 点 击 或 按键 盘 来 激活 它 。 

QPushButton 的 构造 函数 很 简单 : 

QPushButton::QPushButton(const QString &text, QWidget *parent, const char* name=0 ) 

第 一 个 参数 是 按钮 标签 的 文本 ， 第 二 个 是 父 构件 ， 最 后 一 个 是 由 Qt 在 其 内 部 使 用 的 按钮 名 字 。 

parent 参 数 是 所 有 Qwidget 都 有 的 参数 ， 父 构件 控制 该 构件 什么 时 候 显 示 和 销毁 ， 以 及 其 他 各 种 
特性 。 传 递 HULL 给 parent 参 数 表 示 该 构件 是 顶层 构件 ，Qt 将 创建 一 个 空白 窗口 来 包含 它 。 在 本 例 中 ， 
你 使 用 this 为 parent 参 数 传递 了 当前 的 Buttonwindow 对 象 ， 这 将 把 这 个 按钮 添加 到 ButtonWindow 
主 区 域 中 。 

name 参 数 设置 构件 在 Qt 内 部 使 用 的 名 字 。 如 果 Qt 遇 到 错误 , 则 该 名 字 会 显示 在 输出 的 错误 信息 中 ， 
因此 你 应 该 选择 一 个 合适 的 构件 名 字 ， 这 样 可 以 在 调试 时 节省 大 量 时 间 。 
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你 可 能 已 注意 到 ， 程 序 只 是 很 随便 地 通过 设置 PushButton 构 造 函 数 的 parent 参数 ， 将 
QPushButton 漆 加 到 Buttonwindow 中 。 它 没有 指定 构件 的 位 置 、 大 小 、 边 界 或 其 他 类 似 的 属性 。 如 果 
想 精确 控制 构件 的 布局 (这 对 创建 一 个 有 吸引 力 的 用 户 界面 很 关键 )， 你 就 必须 使 用 Qt 的 布局 对 象 。 
下 面 就 让 我 们 来 看 看 它 。 

Qt 中 有 很 多 种 方法 可 以 用 来 排列 构件 的 位 置 和 布局 。 你 已 经 看 到 可 以 通过 调用 setceomet ry 来 设 
置 绝 对 坐标 ， 但 这 很 少 使 用 。 因 为 当 调 整 窗口 大 小 时 ， 构 件 不 会 做 相应 地 调整 来 适应 窗口 。 

排列 构件 的 首选 方法 是 使 用 QLayout 类 或 Box 构 件 ， 在 你 给 出 构件 的 边 距 值 和 构件 间 的 间距 值 后 ， 
它们 会 根据 情况 自动 调整 大 小 。 

Qbayout 类 和 Box 构 件 之 间 的 主要 不 同 是 ， 布 局 对 象 不 是 构件 。 

布局 类 派生 自 aobject 而 不 是 Qwiaget ， 因 此 你 在 使 用 它 时 受到 一 些 限制 。 比 如 ， 你 不 能 将 
QVBoxLayout 作 为 QMainWwindow 的 中 心 构件 。 

与 布局 类 相反 ，Box 构 件 ( 如 QHBox 和 QvBox) 派生 自 Qwiaget， 因 此 你 可 以 把 它们 看 做 为 普通 的 构 
件 。 你 可 能 会 奇怪 为 什么 Qt 同时 有 QLayout 和 QBox 且 两 者 具有 重复 的 功能 。 其 实 oBox 构 件 只 是 为 了 方 
W, 本 质 上 它 是 在 一 个 owiaget 中 包含 了 一 个 QLayout。QLayout 具 备 自动 调整 大 小 的 优势 , 而 构件 则 
必须 通过 调用 Qwiaget : :resizeEvent () 来 手工 调整 大 小 。 

QLayout 的 子 类 QVBoxLayout 和 QHBoxLayout 是 创建 界面 最 常用 到 的 方法 ， 也 是 你 在 Qt 代码 中 最 
常见 的 类 。 

QVBoxLayout 和 QHBoxLayout 都 是 不 可 见 的 容器 对 象 ， 它 们 分 别 以 垂直 和 水 平 的 方向 包含 其 他 构 
件 和 布局 。 你 可 以 创建 一 个 任意 复杂 的 构件 排列 ， 因 为 你 可 以 对 布局 进行 嵌 套 。 例如， 将 一 个 横向 布 
局 作为 一 个 元 素 放置 到 一 个 纵向 布局 中 。 

下 面 是 我 们 感 兴趣 的 3 个 QVBoxLayout 构 造 函数 〈oHBoxLayout 有 相似 的 APID); 

QVBoxLayout::QVBoxLayout (QWidget *parent, int margin, int spacing, const char 

*name 
QVBoxLayout : : QVBoxLayout. Deren *parentLayout, int spacing, const char * name) 
QVBoxLayout::QVBoxLayout (int spacing, const char *name) 


QLayout 的 parent 参 数 可 以 是 一 个 构件 或 是 另 一 个 QLayout。 如 果 没 有 指定 parent， 那 么 你 以 后 
只 能 通过 aGaLayout 方 法 把 这 个 布局 加 到 另外 一 个 gLayout 中 去 。 
margin 和 spacing 设 置 围绕 在 QLayout 四 周 的 边 距 和 构件 间 的 间隔 的 像素 值 。 
“ 旦 创建 了 QLayout 对 象 ， 你 就 可 以 用 下 面 两 个 方法 分 别 添加 子 构件 和 布局 : 
QBoxLayout::addWidget (QWidget *widget, int stretch = 0, int alignment = 0 ) 
QBoxLayout::addLayout (QLayout *layout, int stretch = 0) 


实验 使 用 gBoxLayout 类 


在 本 例 中， 你 通过 在 Qainwindow 中 安排 一 个 QLable 构 件 来 了 解 0BoxLayout 类 的 实际 使 用 情况 。 
(1) 首先 ， 编 写 头 文件 LayoutWinGow.h: 


#include <qmainwindow.h> 





class LayoutWindow : public QMainWindow 
t 
Q. OBJECT 


public: 
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LayoutWindow(QWidget *parent - 0, const char *name - 0); 
virtual -LayoutWindow(); 


5 
(2) 然后 ， 编 写 类 的 实现 文件 Layoutwindow.cpp: 


#include «qapplication.h» 
#include <qlabel.h> 
finclude <qlayout.h> 


#include *LayoutWindow.moc* 


LayoutWindow::LayoutWindow(QWidget *parent, const char *name) : QMainWindow(parent, name) 
t 
this-»setCaption(*Layouts*); 


(3) 你 需要 创建 一 个 哑 Qwidget 来 容纳 QHBoxLayout， 这 是 因为 你 不 能 在 QMainwindow 中 直接 增加 
QLayout: 


QWidget *widget = new QWidget(this); 
setCentralWidget (widget); 


QHBoxLayout *horizontal = new QHBoxLayout(widget, 5, 10, "horizontal'); 
QVBoxLayout *vertical - new QVBoxLayout(); 


QLabel* labell = new QLabel(*Top', widget, "textLabell" ); 
QLabel* label2 = new QLabel(*Bottom", widget, "textLabel2*); 
QLabel* label3 = new QLabel(*Right*, widget, "textLabel3*); 


vertical-»addWidget (label1); 
vertical-»addWidget (1abel2); 
horizontal-»addLayout (vertical); 
horizontal-»addWidget (1abeli); 
resize( 150, 100 ); 

H 


LayoutWindow: 
{ 
} 





~LayoutWindow() 





int main(int argc, char 
( 

QApplication app(argc,argv); 

LayoutWindow *window = new LayoutWindow(); 


rgv) 


app.setMainWidget (window); 
window-»show(); 





return app.exec(); 





像 前 面 一 样 ， 你 需要 在 编译 之 前 在 头 文件 上 : 


$ moc LayoutWindow.h -o LayoutWindow.moc 
$ g++ -o layout LayoutWindow.cpp -I$QTDIR/include -L$QTDIR/lib -lqui 


行 moc: 
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运行 这 个 程序 ,你 将 看 到 儿 个 QLabe1 的 位 置 被 安排 好 了 ( 见 图 17-4). 试 着 改 
变 窗 口 的 大 小 ， 看 看 标签 怎样 根据 窗口 的 大 小 放大 和 缩小 。 

Layoutwindow.cpp 的 代码 创建 了 两 个 盒 布局 构件 用 于 放置 构件 , 分 别 是 横向 
盒 布 局 构件 和 纵向 盒 布局 构件 。 纵 向 盒 布 局 放置 了 两 个 标签 ， 分 别 为 Top 和 图 





Bottom。 横 向 盒 布 局 也 放置 了 两 个 构件 ， 一 个 是 显示 为 Right 的 标签 ， 另 一 个 是 Kot 
纵向 盒 布局 构件 。 你 可 以 像 本 例 中 那样 ， 随 意 地 在 一 个 布局 构件 中 放置 另 一 个 布局 构件 。 
你 可 以 尝试 修改 rayoutwindow.cpp 中 的 代码 ， 以 便 更 好 地 了 解 盒 布局 的 工作 原理 。 


我 们 已 经 介绍 了 Qt 的 基本 概念 一 一 信号 和 槽 、moc 和 布局 。 现 在 是 时 候 进 - 





讨论 各 个 构件 了 。 
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Qt 中 有 针对 各 种 用 途 的 构件 ， 如 果 全 部 讨论 就 会 占用 很 大 的 篇 幅 。 在 本 节 中 ， 你 将 看 到 一 些 常见 
的 Qt 构件 ， 包 括 ， 数据 输入 构件 、 按 钮 、 组 合 框 和 列表 构件 。 
17.4.1 QineEdit 

QineEaic 是 Qt 的 单行 文本 输入 构件 。 你 可 以 用 它 来 输入 简短 的 文本 ， 如 用 户 的 名 字 。 在 使 用 该 
构件 时 ， 你 可 以 使 用 一 个 输入 掩 码 来 限制 输入 以 符合 模板 的 要 求 ， 或 者 为 了 实现 最 终 控制 ， 你 可 以 应 
用 一 个 验证 函数 (例如 ， 为 了 确保 用 户 输入 一 个 正确 的 日 期 、 电 话 号 码 或 其 他 类 似 的 值 )。QLineEait 
具有 编辑 特性 ， 它 允许 你 从 一 个 用 户 的 角度 或 是 使 用 API 的 角度 来 选择 部 分 文本 、 剪 切 和 粘贴 、 撤 销 、 
重 做 等 。 

它 的 构造 函数 和 最 有 用 的 方法 有 : 

#include «qlineedit.h» 





QLineEdit::QlineEdit (QWidget *parent, const char* name = 0 ) 
QLineEdit::QLineEdit (const QString &contents, QWidget *parent, 
const char *name = 0 ) 
QLineEdit::QLineEdit (const QString &contents, const QString &inputMask, 
QWidget *parent, const char *name = 0 ) 


void ^ setInputMask (const QString &inputMask) 
void ^ insert (const QString &newText ) 

bool ^ isModified (void) 

void MaxLength (int length) 

void ReadOnly (bool read) 

void setText (const QString &text) 

QString text (void) 

void setEchoMode (EchoMode mode) 


在 构造 函数 中 ， 你 像 往常 一 样 通过 参数 parent 和 name 来 设置 父 构 件 和 构件 名 。 
一 个 有 趣 的 属性 是 EchoMode， 它 决定 文本 在 构件 中 的 显示 方式 。 

它 可 以 取 下 面 3 个 值 之 

U QLineEdit::Normal: 显示 输入 的 字符 ORO. 

O QLineEdit: :Password: 显示 星 号 (用 星 号 来 取代 字符 )。 
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O QLinerdit::NoEcho: 什么 也 不 显示 。 
使 用 setEchoMode 来 设置 模式 : 


lineEdit-»setEchoMode (QLineEdit: : Password) ; 


Qt3.2 引 入 了 一 个 增强 特性 inputMask， 它 按 掩 码 规则 来 限制 输入 。 

inputMask 是 一 个 由 字符 组 成 的 字符 串 , 其 中 每 个 字符 都 对 应 一 个 接受 某 个 特定 字符 范围 的 规则 。 
如 果 你 熟悉 正则 表达 式 ，inputMask 使 用 的 原理 与 其 基本 相同 。 

inputMask 字 符 有 两 种 类 型 : 一 类 是 表示 某 个 特定 字符 必须 出 现 , 另 一 类 指示 如 果 某 个 字符 出 现 ， 
它 需 要 受到 规则 的 限制 。 表 17-1 显 示 了 这 些 字符 的 示例 和 它们 的 含义 。 








表 17-1 
必需 字符 可 选 字符 *& x 
A a ASCII 字 符 A 一 Z,a 一 z 
N n ASCII 字 符 A 一 Z，a 一 z，0 一 9 
x x 任意 字符 
9 0 数字 0 一 9 
D d 数字 1 一 9 





inputMask 是 一 个 由 这 些 字 符 组 合 在 一 起 构成 的 字符 串 ， 有 时 以 分 号 结束 。 还 有 几 个 具有 特殊 含 
义 的 字符 ， 如 表 17-2 所 示 。 
表 17-2 
字 符 & x 
+ 字符 可 以 出 现 但 不 是 必须 的 
将 接 下 来 的 输入 字符 转换 为 大 写 
将 接 下 来 的 输入 字符 转换 为 小 写 
停止 大 小 写 转换 
将 特殊 字符 转 义 为 分 隔 符 


inputMask 中 的 所 有 其 他 字符 在 QLineEaic 中 都 被 视 为 分 隔 符 。 
表 17-3 显 示 了 一 些 掩 码 示例 和 它们 允许 的 输入 。 








2- ave 
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5 F 允许 的 输入 
"AAAAAA-999D" 允许 Athens-2004， 不 允许 Sydney-2000 或 Atlanta-1996 
"AAAANN-99-99:" 允许 March-03-12， 不 允许 May-03-12 或 September-03-12 
*000.000.000.000* 允许 输入 IP 地 址 ， 例 如 : 192.168.0.1 





| Bf orinezait 


现在 看 一 下 QLineEdit 的 实际 使 用 情况 。 
(1) 首先 是 头 文件 LineEait.h: 
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finclude 
#include 
#include 


<qmainwindow.h> 
<qlineedit .h> 
<qstring.h> 


class LineEdit : public QMainWindow 


t 


Q. OBJECT 


public 


LineEdit(QWidget *parent - 0, const char *name - 0); 
QLineEdit *password entry; 


private slots: 


void 
u 


Clicked(); 


(2) Linezdit .cpp 是 我 们 很 熟悉 的 类 实现 文件 : 


#include 
#include 
#include 
#include 
#include 
#include 


LineEdit 
t 


"LineEdit.moc* 
«qpushbutton.h» 
«qapplication.h» 
«qlabel.h» 
«glayout.h» 
<iostream> 


::LineEdit (QWidget *parent, const char *name) : QMainWindow(parent, name) 


QWidget *widget = new QWidget(this); 
setCentralWidget (widget); 


(3) 用 ocriarayout 排 列 构件 。 指 定 行 数 、 列 数 、 边 距 和 间隔 ， 
QGridLayout *grid = new QGridLayout(widget,3,2,10, 10,"grid*); 


QLineEdit *username entry = new QLineEdit( widget, "username entry*]; 
password entry - new QLineEdit( widget, "password entry"); 
password entry-»setEchoMode (QLineEdit::Password); 


grid-»addWidget(new QLabel(*Username*, widget, "userlabel'), 0, 0, 0); 
grid-»addWidget(new QLabel ("Password", widget, "passwordlabel"), 1, 0, 0); 


grid-»addWidget(username entry, 0,1, 0); 
grid-»addWidget(password entry, 1,1, 0 





QPushButton *button = new QPushButton (*Ok*, widget, "button"; 
grid-»addWidget(button, 2,1,Qt::AlignRight):; 


resize 


( 350, 200 ); 


connect (button, SIGNAL(clicked()), this, SLOT(Clicked())); 


} 


void LineEdit::Clicked(void) 
t 
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std::cout << password entry-»text() << “\n"; 
) 


int main(int argc, char **argv) 

{ 
QApplication app(argc,argv):; 
LineEdit *window = new LineEdit(); 


app.setMainWidget (window); 
window-»show(); 


return app.exec(); 


) 
运行 这 个 程序 ， 你 将 看 到 如 图 17-5 所 示 的 窗口 。 


(i erict]Gkayakchomezjerictj/writing/Beginning Linux Programming ath Ed/c — n x 
He Edt vew Jemina Ths Heip 

[ericfj@kayok chap17 src]$ ./lincedit 日 
e boh H 





















图 17-5 


上 述 创建 了 两 个 QLineEait 构 件 ， 其 中 一 个 通过 设置 它 的 EchoMode 将 其 变 为 密码 输入 框 ， 当 你 点 
击 PushButton 按 钮 时 ， 它 的 内 容 将 被 输出 。 注 意 ， 程 序 中 引入 了 一 个 ocriaLayout 构 件 ， 当 在 网 格 模式 
下 布置 构件 时 ， 它 非常 有 用 。 当 你 要 把 一 个 构件 添加 到 网 格 中 时 ， 需 要 传递 行 号 和 列 号 。 左 上 角 的 单元 
格 是 起 始 单元 格 ， 它 的 行列 号 分 别 是 0，0。 





17.4.2 Qt 按钮 


按钮 构件 是 一 种 随处 可 见 的 构件 ， 不 同 的 工具 包 中 它 的 外 观 、 用 法 和 API 都 变化 不 大 。Qt 当 然 也 
提供 了 标准 的 PushButton、cCheckBox 和 RadioButton 的 变 体 。 

1. QButton: 按钮 基 类 

Qt 中 的 按钮 构件 都 是 派生 自 抽象 类 QButton。 这 个 类 有 查询 和 切换 按钮 开关 状态 的 方法 ， 还 有 设 
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置 按钮 文本 或 位 图 的 方法 。 

你 永远 不 需要 实例 化 一 个 OButton 构 件 自身 (不 要 混淆 QButton 和 QPushButton) ， 所 以 这 里 也 
不 用 显示 它 的 构造 函数 ， 但 下 面 列 出 了 它 的 几 个 有 用 的 成 员 函 数 : 

#include «qbutton.h» 





virtual void QButton::setText ( const QString & ) 
virtual void QButton::setPixmap ( const QPixmap & ) 

bool QButton::isToggleButton () const 

virtual void QButton::setDown ( bool ) 

bool QButton::isDown () const 

bool QButton::isOn () const 

enum QButton::;ToggleState ( Off, NoChange, On ) 

ToggleState QButton::state () const 

ispown 和 ison 函 数 的 作用 是 相同 的 。 它 们 都 在 按钮 被 按 下 或 激活 时 返回 TRUE。 

通常 , 当 某 个 选项 当前 不 可 用 时 , 你 希望 能 禁用 它 或 让 它 显示 为 灰色 。 你 可 以 通过 调用 Qwiaget: ， 
setEnable (FALSE) 来 禁用 包括 OButton 在 内 的 任何 构件 。 

下 面 是 3 个 我 们 感 兴趣 的 0Button 子 类 。 

O QPushButton: 一 个 简单 的 按钮 构件 ， 它 在 被 点 击 时 执行 一 些 动作 。 

O QCheckBox: 一 个 可 以 在 开 / 关 〈on/off) 状态 之 间 切 换 ， 用 于 表示 某 一 选项 的 按钮 构件 。 

O QRadioButton: 通常 在 组 中 使 用 的 按钮 构件 ， 一 组 内 同时 只 能 激活 一 个 按钮 。 

2. gPushButton 

QPushButton 是 一 个 标准 的 通用 按钮 ， 它 包含 如 OK 或 Cancel 这 样 的 文本 或 一 个 像素 映射 图 标 。 与 
所 有 的 QButton 一 样 ， 当 它 被 激活 时 会 发 出 一 个 clicked 信 号 ， 这 个 信号 通常 会 连接 到 一 个 槽 并 执行 

- 些 动作 。 

你 已 在 前 面 的 例子 中 用 过 QPushButton， 关 于 这 个 最 简单 的 Qt 构件 还 有 一 件 值得 说 的 事 ， 你 可 以 
调用 setToggleButton 将 QPushButton 从 一 个 无 状态 按钮 转变 为 一 个 开关 按钮 ( 即 它 可 以 被 打开 或 关 
闭 )。 请 回忆 上 一 章 的 内 容 ，GTK+ 用 一 个 单独 的 构件 实现 此 功能 。 

从 完整 性 考虑 ， 这 里 提供 了 它 的 构造 函数 和 几 个 有 用 的 方法 ; 

#include «qpushbutton.h» 

















QPushButton (QWidget *parent, const char *name = 0) 

QPushButton (const QString &text, QWidget *parent, const char *name = 0) 

QPushButton (const QIconSet &icon, const QString &text, 

QWidget *parent, const char * name = 0 ) 

void QPushButton::setToggleButton (bool); 

3. QcheckBox 

QcheckBox 是 一 个 有 状态 的 按钮 ， 也 就 是 说 ， 它 可 以 被 打开 或 关闭 。 它 的 外 观 取决 于 当前 的 窗口 
样式 (Motif、Windows 等 )， 但 它 通 常 是 一 个 右边 有 文本 的 打 义 

你 还 可 以 将 gcheckBox 设 置 为 第 三 种 状态 ( 即 中 间 状 态 ) 以 表示 “无 改变 "。 这 在 极 少数 情况 下 会 
用 到 , 比如 说 你 无 法 读 取 ocheckBox 代 表 的 选项 的 状态 (因此 , 你 自己 设置 ccheckBox 的 打开 或 关闭 )， 
但 是 仍然 想 给 用 户 一 个 机 会 保持 它 状 态 的 不 变 。 


#include «qcheckbox.h» 
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QcCheckBox (QWidget *parent, const char *name = 0 ) 
QCheckBox (const QString &text, QWidget *parent, const char *name = 0 ) 


bool QCheckBox::isChecked () 

void QCheckBox::setTristate ( bool y = TRUE ) 

bool QCheckBox::isTristate () 

4. QRadioButton 

单 选 按钮 是 开关 按钮 , 它 用 于 在 一 组 选项 中 只 能 选择 一 个 选项 的 情况 (回想 那些 老式 汽车 的 收音 机 ， 
每 次 只 有 一 个 电台 按钮 可 以 被 按 下 )。ORaaioButton 本 身 与 ccheckBox 几 乎 没有 什么 区 别 ， 这 是 因为 
按钮 的 分 组 和 单 选 性 都 是 由 QButtonGroup 类 来 处 理 的 。 它 们 之 间 主 要 的 区 别 是 ， 单 选 按钮 的 外 观 是 加 
的 ， 而 不 是 一 个 打 勾 框 。 

QButtonGroup 是 一 个 构件 ， 它 提供 了 一 些 便捷 的 方法 ， 使 得 按钮 组 的 处 理 更 加 容易 : 

#include «qbuttongroup.h» 


QButtonGroup (QWidget *parent = 0, const char * name = 0 ) 
QButtonGroup (const QString & title, QWidget * parent = 0, const char * name = 0 ) 


int insert (QButton *button, int id = -1) 

void remove (QButton *button) 

int id (QButton *button) const 

int count () const 

int selectedId () const 

QButtonGroup 的 用 法 非常 简单 ， 如 果 你 使 用 带 tit1e 参 数 的 构造 函数 ， 它 甚至 还 提供 了 一 个 可 选 
的 包围 按钮 的 框架 。 

你 有 两 种 向 QButtonGroup 添 加 一 个 按钮 的 方法 ， 一 种 是 用 insert 方 法 ， 另 一 种 是 将 
QButtonGroup 指 定 为 按钮 的 父 构件 。 你 可 以 在 调用 insert 时 指定 一 个 ia 来 唯一 标识 组 中 的 每 个 按钮 。 
这 在 查询 哪个 按钮 被 选中 时 特别 有 用 ， 因 为 selectIG 返 回 被 选中 按钮 的 1a。 

所 有 加 到 组 内 的 QRadioButcon 都 自动 具有 了 单 选 性 。 

下 面 是 QRaGioButton 的 构造 函数 和 唯一 的 方法 : 

#include <qradiobutton.h> 


QRadioButton (QWidget *parent, const char *name = 0 ) 
QRadioButton (const QString &text, QWidget *parent, const char *name = 0 ) 


bool  QRadioButton::isChecked () 


X ry QButton 
-我 们 通过 一 个 Qt 按钮 的 示例 程序 来 应 用 这 些 知识 。 下 面 这 个 程序 通过 创建 不 同类 型 的 按钮 ( 单 
选 按钮 、 检 查 框 和 标准 按钮 ) 来 显示 如 何在 应 用 程序 中 使 用 这 些 构件 。 

(1) ff A Buttons. h: 








finclude «qmainwindow.h» 
include «qcheckbox.h» 
*include «gbutton.h» 
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#include «qradiobutton.h» 


class Buttons : public QMainWindow 
{ 
Q_OBJECT 


public: 
Buttons(QWidget *parent = 0, const char *name = 0); 


(2) 稍 后 ， 你 将 在 槽 函数 中 查询 按钮 的 状态 ， 所 以 在 类 定义 中 将 按钮 指针 声明 为 和 有 ， 还 有 


辅助 函数 PrintActive 也 是 私有 的 : 


private: 
void PrintActive(QButton *button); 
QCheckBox *checkbox; 
QRadioButton *radiobuttonl, *radiobutton2; 


private slots: 
void Clicked(); 


u 

(3) 下 面 是 Buttons .cpp: 
#include "Buttons.moc" 
#include «qbuttongroup.h» 
#include «qpushbutton.h» 


#include <qapplication.h> 
#include <qlabel.h> 
#include «qlayout.h» 


#include <iostream> 


Buttons::Buttons(QWidget *parent, const char *name) : QMainWindow(parent, name) 
€ 
QWidget *widget = new QWidget(this); 


setCentralWidget (widget); 





QVBoxLayout *vbox = new QVBoxLayout (widget,5, 10,"vbox'); 


checkbox = new QCheckBox(*CheckButton", widget, "check*); 
vbox-»addWi dget (checkbox) ; 


(4) 你 为 两 个 单 选 按钮 创建 了 一 个 oOButconGroup: 
QButtonGroup *buttongroup = new QButtonGroup(0); 


radiobuttonl = new QRadioButton(*RadioButtonl*, widget, "radiol'); 
buttongroup-»insert (radiobuttonl); 
vbox-»addiidget (radiobuttonil); 


radiobutton2 = new QRadioButton("*RadioButton2*, widget, "radio2"); 
buttongroup-»insert (radiobutton2); 


个 
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vbox-»addWidget (radiobutton2); 


QPushButton *button = new QPushButton ("Ok", widget, "button*); 
vbox-»addWidget (button) ; 


resize( 350, 200 ); 


connect (button, SIGNAL(clicked()), this, SLOT(Clicked()]); 
) 


(5) 接 下 来 是 一 个 输出 给 定 OButton 状 态 的 便捷 方法 : 


void Buttons::PrintActive(QButton *button) 
( 
if (button-»isOn()) 
Std::cout << button-»name() << * is checkedin'; 
else 
std::cout << button-»name() << * is not checkedin'; 
) 


void Buttons::Clicked(void) 

t 
PrintActive(checkbox); 
PrintActive(radiobuttonl); 
PrintActive(radiobutton2); 
std::cout << "in*; 

) 


int main(int argc, char **argv) 
t 


QApplication app(argc,argv); 
Buttons *window = new Buttons(); 


app.setMainWidget (window) ; 
window-»show(); 


return app.exec(]; 


) 


这 个 简单 的 例子 显示 了 如 何 查询 各 种 类 型 的 Qt 按钮 。 正 如 你 所 看 到 的 ， 这 些 构件 在 创建 后 大 多 数 
情况 下 的 工作 方式 基本 相同 ,例如 , PrintActive 函 数 显示 了 如 何 获取 一 个 按钮 的 状态 (打开 或 关闭 )。 
请 注意 ， 这 个 函数 可 以 用 于 所 有 维持 状态 的 按钮 类 型 ， 如 检查 框 和 单 选 按钮 。 在 大 多 数 情况 下 ， 只 有 
创建 这 些 按钮 构件 的 方法 彼此 不 同 。 相 对 而 言 ， 单 选 按钮 的 创建 过 程 是 最 复杂 的 《因为 一 个 组 中 同时 
只 能 有 一 个 按钮 处 于 打开 状态 ) ， 它 需要 的 工作 量 最 大 。 对 单 选 按钮 来 说 ， 你 需要 先 创建 一 个 
QButtonGroup， 以 确保 组 中 在 任何 时 候 只 能 有 一 个 单 选 按钮 是 激活 的 。 





17.4.3 QComboBox 


单 选 按钮 适用 于 用 户 从 少量 选项 (6 个 或 更 少 ) 中 进行 选择 的 情况 。 当 多 于 6 个 选项 时 ， 你 就 很 难 
控制 窗口 的 大 小 在 一 个 合理 的 范围 内 ， 而 且 随 着 选项 数目 的 增多 ， 这 一 状况 会 越 来 越 严重 。 一 个 完美 
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的 解决 方案 是 使 用 一 个 带 有 下 拉 菜 单 的 输入 框 ， 即 组 合 框 。 当 你 点 击 菜单 时 选项 才 会 出 现 ， 选 项 的 数 
目 只 受到 搜索 选项 列表 方便 程度 的 限制 

QcomboBox 结 合 了 QLineEdit、QPushButton 和 下 拉 菜 单 的 功能 ， 它 使 用 户 可 以 从 一 个 无 限 的 选 
项 中 选择 一 个 选项 。 

QcomboBox 可 以 是 读 / 写 或 只 读 的 。 在 读 / 写 模式 下 ， 用 户 可 以 输入 一 个 替代 选项 ， 而 在 只 读 模式 
下 ， 用 户 只 能 从 下 拉 菜 单 中 进行 选择 。 

在 创建 ocomboBox 时 ， 你 可 以 通过 其 构造 函数 的 一 个 布尔 值 参数 来 指定 它 是 读 / 写 模式 , 还 是 只 读 
Bot. 

QComboBox *combo = new QComboBox(TRUE, parent, "widgetname*); 


传递 TRUE 将 QcomboBox 设 置 为 读 / 写 模式 。 其 他 参数 是 常见 的 父 构件 指针 和 构件 名 。 

与 所 有 Qt 构件 一 样 ，QcomboBox 的 使 用 方式 很 灵活 ， 而 且 它 提供 了 大 量 的 功能 。 你 可 以 单个 添加 
选项 ， 也 可 以 一 次 添加 一 组 〈 使 用 Qstring 或 传统 的 char* 格 式 ) 。 

你 可 以 调用 insertItem 来 插入 一 个 选项 : 

combo-»insertItem(QString("An Item*), 1); 


它 有 一 个 ostring 对 象 参数 和 一 个 位 置 索引 参数 。 值 1 设置 该 选项 为 列表 中 的 第 一 个 选项 。 如 果 你 
想 将 它 添加 到 列表 的 末尾 ， 只 需 传递 一 个 任意 的 负 整 数 即 可 。 

更 常见 的 情况 是 一 次 添加 多 个 选项 ， 这 时 你 可 以 使 用 0strList 类 ， 或 者 像 下 面 这 样 用 一 个 char* 
数组 : 

char* weather[] = ("Thunder*, "Lightning", "Rain", 0); 

combo->insertStrList (weather, 3); 

同样 ， 你 也 可 以 指定 插入 项 在 列表 中 的 索引 。 

如 果 QcomboBox 是 读 / 写 模式 ， 那么 用 户 输入 的 值 将 自动 加 入 到 选项 列表 中 。 这 是 一 个 很 有 用 的 节 
省 时 间 的 功能 ， 当 用 户 想 不 止 一 次 地 选择 同一 个 输入 值 时 ， 它 可 以 节省 用 户 重复 输入 的 时 间 。 

InsertionPolicy 控 制 新 输入 的 值 在 选项 列表 的 何 处 插入 。 你 可 以 选择 的 选项 见 表 17-4。 















表 174 

选 项 作 用 
QComboBox: : 将 新 输入 的 值 作为 列表 的 第 一 项 插入 
QComboBox : 将 新 输入 的 值 作为 列表 的 最 后 一 项 插入 
QComboBox: :AtCurrent 替换 前 一 个 选中 的 项 
QComboBox: :BeforeCurrent 在 前 一 个 选中 的 项 之 前 插入 新 输入 的 值 
QComboBox: :AfterCurrent 在 前 一 个 选中 的 项 之 后 插入 新 输入 的 值 
QComboBox: :NoInsertion 新 输入 的 值 不 插入 选项 列表 





你 可 以 调用 set InsertionPolicy 方 法 来 设置 QComboBox 的 插入 策略 : 
combo->setInsertionPolicy (QComboBox: :AtTop) ; 


下 面 看 一 下 QcomboBox 的 构造 函数 和 部 分 方法 : 
#include «qcombobox.h» 


QcomboBox (QWidget *parent = 0, const char *name = 0) 
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QComboBox (bool readwrite, QWidget *parent = 0, const char *name = 0) 


int count () 

void ^ insertStringList (const QStringList &list, int index = -1) 
void ^ insertStrList (const QStrList &list, int index = -1) 

void ^ insertStrList (const QStrList *list, int index = -1) 

void ^ insertStrList (const char **strings, int numStrings = -1, int index = -1) 
void ^ insertItem (const QString &t, int index = -1) 

void removeItem (int index) 

virtual void setCurrentItem (int index) 

QString currentText () 

virtual void setCurrentText (const QString &) 

void ^ setEditable (bool) 


count 函 数 返 回 列表 中 选项 的 数目 。QstringList 和 QstrList 是 你 可 以 用 来 增加 选项 的 Qt 字符 串 
集合 类 。 你 可 以 调用 removeItem 来 删除 选项 ， 调 用 currentText 和 setcurrentText 来 获取 和 设置 当 
前 选项 ， 调 用 setEditable 来 切换 可 编辑 状态 

每 当 一 个 新 选项 被 选中 时 ，QcomboBox 就 发 出 Lextchangeda (ostringg) 信号 ， 并 以 新 选中 的 选 
项 做 为 其 参数 。 








实 验 ocombopox 


在 本 例 中 ， 你 将 尝试 使 用 gcomboBox， 并 看 到 带 参数 的 信号 和 榴 是 如 何 工作 的 。 你 
承 自 oMainWwindow 的 ComboBox 类 。 它 有 两 个 QcomboBox， 一 个 是 读 / 写 模式 ,一 个 是 只 i 
接 textchangeaG 信 号 ， 以 获取 每 次 选中 的 值 。 

(1) 输入 下 列 代 码 ， 并 将 它 命名 为 ComboBox.h: 


#include «qmainwindow.h» 
#include «qcombobox.h» 


将 创建 一 个 继 
模式 ,你 将 连 





class ComboBox : public QMainWindow 
{ 
Q_OBJECT 


public: 
ComboBox(QWidget *parent = 0, const char *name = 0); 


private slots: 
void Changed(const QString& s); 
J: 
(2) 界面 由 两 个 0comboBox 构 件 组 成 ， 一 个 可 编辑 ， 另 一 个 是 只 读 模 式 。 你 在 两 个 构件 中 放置 相同 
的 选项 列表 : 


#include "ComboBox.moc* 


*include «qlayout.h» 
*include <iostream> 


ComboBox::ComboBox(QWidget *parent, const char *name) : QMainWindow(parent, name) 
t 
QWidget *widget = new QWidget(this); 
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setCentralWidget (widget); 
QVBoxLayout *vbox = new QVBoxLayout(widget, 5, 10,"vbox*); 


QComboBox *editablecombo = new QComboBox(TRUE, widget, *editable*); 
vbox-»addWidget (edi tablecombo) ; 

QComboBox *readonlycombo = new QComboBox(FALSE, widget, 'readonly*); 
vbox-»addwidget (xeadonlycombo) ; 


static const char* items[] = ( "Macbeth", "Twelfth Night", "Othello", 
editablecombo-»insertStrList (items); 
readonlycombo-»insertStrList (items); 


connect (editablecombo, SIGNAL(textChanged(const QString&)), 
this, SLOT(Changed(const Qstring&))]; 
resize( 350, 200 ); 


} 

O 下 面 是 柳 函 数 。 注 意 由 信号 传递 的 0string 参 数 : 
void ComboBox::Changed(const QString& s) 

( 


std::cout << s << "Wn*; 


) 


int main(int argc, char **argv) 

t 
QApplication app(argc,argv); 
ComboBox *window = new ComboBox(); 


app.setMainWidget (window); 
window-»show(); 


return app.exec(); 
) 


在 图 17-6 中 ， 你 可 以 看 到 ， 可 编辑 的 0comboBox 里 新 选中 的 选项 输出 在 命令 行 上 。 








图 17-6 
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创建 组 合 框 构件 的 过 程 与 创建 任何 其 他 构件 的 过 程 非常 相似 。 它 主要 增加 了 一 个 对 
insertStrList 函 数 的 调用 来 存储 组 合 框 的 选项 列表 。 

和 其 他 包含 文本 的 构件 一 样 ， 你 可 以 设置 一 个 函数 , 每 当 组 合 框 中 的 值 (或 更 通用 的 说 法 : 文本 ) 
被 改变 时 ， 该 函数 就 会 被 调用 。 





17.4.4 QListView 


Qt 中 的 列表 和 树 由 QListView 构 件 提供 。QListview 既 可 以 显示 平面 列表 ， 也 可 以 显示 被 分 为 行 
和 列 的 层次 化 数据 。 它 非常 适合 于 显示 如 目录 结构 这 样 的 数据 ， 因 为 子 元 素 可 以 通过 点 击 加 减 +/-) 
框 被 展开 和 收 起 ， 就 像 一 个 文件 查看 器 一 样 。 

与 GTK+ 的 Listview 构 件 不 同 , QListView 同 时 处 理 数据 和 视图 ， 虽然 它 没有 提供 很 好 的 灵活 性 ， 
但 却 提供 了 很 好 的 易 用 性 。 

在 使 用 oristvView 时 ， 你 可 以 选择 行 或 单独 的 单元 ， 然 后 剪 切 和 粘贴 数据 、 按 列 排序 ， 而 且 你 可 
以 在 单元 里 放置 ocheckBox 构 件 。QListview 内 建 了 很 多 功能 ， 程 序 员 只 需 添 加 数据 和 建立 一 些 格式 
规则 。 

你 按 通 常 的 方式 创建 eoListview， 指 定 父 构件 和 构件 名 : 

QListView *view = new QListView(parent, "name"); 

你 可 以 使 用 aadcolumn 方 法 来 设置 列 标题 : 

view-»addColumn(*Left Column', widthl ); // Fixed width 

view-»addColumn(*Right Column"); // Width autosizes 

列 宽 按 像素 设置 ， 如 果 省 略 此 参数 ， 那 么 默认 它 为 该 列 中 最 宽 的 元 素 的 宽度 。 当 列 中 元 素 增加 或 
减少 时 ， 列 会 自动 调整 其 宽度 。 

数据 通过 QListViewItem 对 象 添加 到 QListview， 它 代表 了 一 行 数据 。 你 所 要 做 的 就 是 把 
QListView 和 行 元 素 传递 给 QListViewItem 的 构造 函数 ， 然 后 它 就 被 附加 到 视图 中 : 

QListViewItem *toplevel = new QListViewItem(view, "Left Data", "Right Data"); 


第 一 个 参数 要 么 是 一 个 OListView (本 例 即 是 如 此 ) ， 要 么 是 另 一 个 QListViewItem。 如 果 你 传 
递 了 一 个 QListVviewItem， 这 一 行 会 变 成 该 OListViewItem 的 子 节点 。 树 形 结构 就 是 通过 传递 一 个 
QListView 作 为 顶层 节点 ， 后 续 传 递 的 0ListViewItem 作 为 子 节点 而 形成 的 。 

其 余 参数 是 每 列 的 数据 ， 如 果 没有 设置 就 默认 为 NULL。 

这 样 ， 添 加 一 个 子 节点 只 需要 传递 一 个 顶层 指针 。 如 果 不 想 在 将 来 继续 在 一 个 QListViewItem 下 
添加 子 节点 ， 你 就 不 需要 保存 返回 的 指针 : 

new QListViewtem(toplevel, "Left Data", "Right Data*); // A Child of toplevel 


如 果 看 一 下 oLiscViewItem 的 API， 你 会 看 到 用 于 遍历 树 的 各 种 方法 〈 如 果 你 想 要 修改 特定 行 的 
di 
#include «qlistview.h» 





virtual void ^ insertItem ( QListViewItem * newChild ) 
virtual void ^ setText ( int column, const QString & text ) 
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Virtual QString text ( int Column ) const 
QListViewrtem — *firstchija O const 
QhistViewrtem — «nextsipling O const 
QhistViewrtem — *parent () const 
QListViewrtem +itemAbove 0 
QListViewItem +itemBelow 0 


eR EQatVierH 4 ERrirscchta gage n 然后 ， 通 过 反复 调用 


firstChildfWlnextsipi ing 来 返回 这 个 树 的 一 部 分 或 全 部 。 
下 面 这 段 代码 输出 所 有 顶层 节 点 的 第 一 列 : 


QListViewltem *chiid = view-»firstchild(); 
while(chila) 
t 


gout << myChild-»text(1) << "n"; 
myChild = myChild->nextSibling() i 





可 以 在 Qt API 文档 中 找到 关 FOListView, QListViewrtemfloch, 








这 个 实验 中 ， 运用 你 所 学 的 知识 ， 编 写 -个 短小 的 QListview 构 件 示例 程序 。 
为 简洁 起 见 ， 让 我 们 跳 过 头 文件 ， 直接 看 类 的 实现 文件 Listview.cppy 
#include "ListView.moc* 
ListView: :ListView(QWidget "Parent, const char *name) ; QMainiindow(parent, 
{ 

listview = new QuistView(this, "listviewl"), 
listview-»adacolum ("Artist") i 
1 


tview-»addColum(*Title*); 
listview-»adácolumn( "Catalogue*); 





listview->setRootIsDecorated (TRUE) ; 


QListViewItem *topleve] = new QListViewtem(listview, "Avril Lavigne", 
"Let Go", *AVCD01*); 


new QListViewltem(toplevel, "Complicated*); 
new QástViewltem(toplevel, "skger Boi*); 


setCentraliidget (listview) ; 
} 


int main(int arge, char **argv) 
t 


QApplication app(argc,argv); 
ListView *window - new ListView(); 


app. setMainWidget (window); 
window-»show(); 
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return app.exec(); 
} 


QListview 构 件 看 上 去 很 复杂 , 因为 它 同时 扮演 了 项 目 列表 和 项 
目 树 的 角色 。 你 的 代码 需要 为 列表 中 的 每 个 元 素 创建 一 个 
QListViewItem 实 例 。 每 个 QListviewItem 实 例 都 有 一 个 父 节点 。 使 
用 构件 本 身 作为 其 父 节点 的 是 顶层 节点 ,使 用 另 一 个 QListviewItem 
作为 其 父 节 点 的 是 子 节点 。 这 个 例子 显示 了 一 个 只 有 一 层 深度 的 
QListViewItem 实 例 ， 但 你 实际 上 可 以 创建 更 深 的 节点 树 。 

编译 并 运行 这 个 Listview 例 子 ， 你 将 看 到 如 图 17-7 所 示 的 
QListView 构 件 。 

注意 ， 子 行 是 如 何 相对 于 父 行 缩 进 的 。 加 / 减 框 表明 那里 有 隐藏 或 
可 折 胎 的 行 ， 它 们 在 默认 情况 下 不 展现 出 来 。 你 是 通过 setRootIs- 
Decorated 来 设置 它们 的 。 








17.5 “对话 框 


到 现在 为 止 ， 你 都 是 通过 继承 aainwindow 来 创建 界面 。 对 应 用 程序 中 的 主 窗口 来 说 ， 使 用 
Cainwindow 是 合适 的 ， 但 对 于 生命 期 比较 短 的 对 话 框 来 说 ， 你 应 该 使 用 opialog 构 件 。 

当 你 想 让 用 户 为 某 一 特定 任务 输入 特定 的 信息 时 ， 或 者 你 想 向 用 户 显示 一 些 信息 (如 一 条 警告 或 
错误 信息 ) 时 ， 对 话 框 是 很 有 用 的 。 通 过 继承 Dialog 来 完成 这 些 任务 是 一 个 好 方法 ， 因 为 你 可 以 获 
取 到 一 些 便捷 的 方法 来 运行 对 话 框 ， 使 用 专门 设计 的 信号 和 槽 来 处 理 用 户 响应 。 

除了 通常 的 模式 对 话 模式 对 话 框 以 外 ，Qt 还 提供 了 一 种 半 模 式 对 话 框 。 下 面 我 们 来 回顾 一 
下 模式 对 话 框 和 非 模式 对 话 框 的 区 别 ， 同 时 也 看 看 何 为 半 模式 对 话 框 。 

O 模式 对 话 框 : 阻止 所 有 其 他 窗口 的 输入 ， 以 强制 用 户 响应 当前 对 话 框 。 它 用 于 从 用 户 那里 获取 

即时 的 响应 和 显示 严重 的 错误 信息 。 




















O 非 模式 对 话 框 : 非 阻塞 窗口 , 与 应 用 程序 中 的 其 他 窗口 一 起 正常 操作 。 它 用 于 搜索 或 输入 窗口 ， 
你 可 以 在 它 和 主 窗口 之 间 复 制 、 粘 贴 数据 。 
O 半 模 式 对 话 框 : 一 个 没有 自己 的 事件 循环 的 模式 对 话 框 。 这 样 可 以 将 控制 权 返 回 到 应 用 程序 ， 





但 仍 阻塞 对 话 框 以 外 的 所 有 窗口 输入 。 它 只 在 极 少数 情况 下 有 用 ， 比 如 当 你 有 一 个 进度 条 表示 
某 个 耗 时 的 关键 操作 的 进度 时 ， 你 可 能 想 要 给 用 户 一 个 取消 的 机 会 。 因 为 半 模 式 对 话 框 没有 自 
己 的 事件 循环 ， 所 以 你 必须 定期 调用 QApplication: :processEvents 来 更 新 对 话 框 。 
17.5.1 QDialog 
epialog 是 Qt 中 的 对 话 框 基 类 ， 它 提供 了 exec 和 show 方 法 来 处 理 模式 与 非 模式 对 话 框 ， 集 成 了 
Qrayouk， 并 有 几 个 用 于 响应 按钮 按 下 的 信号 和 模 。 
你 通常 将 为 对 话 框 创建 一 个 继承 自 opialog 的 类 ， 向 其 中 增加 构件 来 创建 对 话 框 界面 ; 
#include «qdialog.h» 


MyDialog::MyDialog(QWidget *parent, const char *name) : QDialog(parent, name) 
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t 
QHBoxLayout *hbox - new QHBoxLayout (this); 


hbox-»addWidget(new Qlabel(*Enter your name*)); 
hbox-»addWidget (new QLineEdit()); 
hbox-»addWidget (ok pushbutton); 

hbox-»addWidget (cancel pushbutton); 


connect (ok pushbutton, SIGNAL(clicked()), this, SLOT(accept())); 
connect (cancel pushbutton, SIGNAL(clicked()), this, SLOT(reject())); 
) 


与 QMainWindow 不 同 ,你 可 以 直接 将 QLayout 对 象 的 parent 参 数 设置 为 MyDialog, 而 无 需 创建 一 
个 无 用 的 owidgec， 并 将 它 作为 QLayout 的 父 构件 。 


注意 ， 这 个 例子 省 略 了 用 于 创建 ok_pushbutton 和 cancel_pushbutton 构 件 的 代码 


QDialog 有 两 个 横 ，(accept 和 reject), 它们 用 于 表明 对 话 框 的 结果 ,这 个 结果 由 exec 方 法 返回 。 
通常 情况 下 ， 你 将 OK 和 Cancel 按 钮 的 信号 连接 到 模 ， 就 像 在 上 面 的 wypialog 类 中 所 做 的 那样 。 
1. 模式 对 话 框 
要 将 对 话 框 作为 模式 对 话 框 ， 你 需要 调用 exec。 该 函数 弹出 对 话 框 ， 并 根据 被 激活 的 模 返 回 
Qpialog::Accepted 或 opialog: :Rejected: 
MyDialog *dialog = new MyDialog(this, "mydialog"); 
if (dialog-»exec() == QDialog::Accepted) 
{ 
// User clicked 'Ok' 
doSomething(); 
) 
else 
( 
// user clicked 'Cancel' or dialog killed 
GoSomethingElse|); 
) 
delete dialog; 


对 话 框 在 exec 返 回 时 会 自动 隐藏 ， 但 你 仍然 要 从 内 存 中 删除 它 。 

注意 ， 在 调用 exec 时 ， 其 他 所 有 处 理 都 被 阻塞 ， 所 以 当 程序 中 有 对 时 间 要 求 比较 高 的 代码 时 ， 使 
用 非 模式 或 半 模式 对 话 框 更 加 合适 一 些 。 

2. 非 模 式 对 话 框 

非 模 式 对 话 框 与 普通 主 窗口 没有 多 大 区 别 ， 主 要 的 不 同 是 非 模式 对 话 框 将 它们 自己 定位 在 其 父 窗 
口 之 上 ， 与 父 窗口 共享 任务 栏 ， 并 在 accept 或 reject 模 被 调用 时 自动 隐藏 

要 显示 一 个 非 模式 对 话 框 ， 与 显示 QMainwindow 的 方式 相同 ， 调 用 show 方 法 即 可 : 

MyDialog *dialog = new MyDialog(this, "mydialog*); 

dialog-»show(); 

show 函 数 显示 对 话 框 ， 随 后 立即 返回 继续 处 理 循环 。 为 了 处 理 按钮 按 下 事件 ， 你 需要 编写 槽 函数 
并 连接 档 : 


MyDialog::MyDialog(QWidget *parent, const char *name) : QDialog(parent, name) 
t 
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connect (ok pushbutton, SIGNAL(clicked()), this, SLOT(OkClicked())]; 
connect (cancel pushbutton, SIGNAL(clicked()), this, SLOT(CancelClicked()]); 
) 


MyDialog::OkClicked() 
t 


//Do some processing 
) 
MyDialog::CancelClicked() 
T 
//Do some other processing 
H 


与 模式 对 话 框 一 样 ， 当 一 个 按钮 被 按 下 时 ， 对 话 框 将 自动 隐藏 。 

3. 半 模式 对 话 框 

要 创建 半 模 式 对 话 框 ， 你 必须 在 QDialog 的 构造 函数 中 设置 模式 标志 ， 并 使 用 show 方 法 : 
QDialog (QWidget *parent=0, const char *name=0, bool modal=FALSE, WFlags f=0) 


对 于 模式 对 话 框 , 你 没有 将 modal 设 置 为 TRUE 的 原因 是 : 有 
而 不 管 这 个 标志 是 什么 。 
半 模 式 对 话 框 的 构造 函数 如 下 所 示 : 


MySMDialog::MySMDialog(QWidget *parent, const char *name):QDialog(parent, name, TRUE) 
t 


) 


一 旦 定义 好 一 个 对 话 框 , 你 就 可 以 调用 show 函 数 , 然后 继续 运行 程序 , 并 定期 调用 QApplication: : 


ProcessEvents 来 更 新 对 话 框 : 





MySMDialog *dialog = MySMDialog (this, "semimodal"); 
dialog-»show(); 

while (processing) 

C 


doSomeProcessing():; 
app-»processEvents() ; 
if (dialog-»wasCancelled()) 
break; 
Y 


在 继续 处 理 之 前 ， 要 保证 对 话 框 未 被 取消 。 注意 ，wascancelled 并 不 是 QDialog 的 一 部 分 ， 你 必 
须 自己 提供 它 。 

Qt 还 提供 了 现成 的 opialog 子 类 ， 它 们 专用 于 特定 的 任务 ， 如 文件 选择 、 文 本 输入 、 进 度 条 和 消 
息 框 等 。 使 用 这 些 构件 可 以 省 去 你 许多 麻烦 。 
17.5.2 QMessageBox 

QMessageBox 是 一 个 模式 对 话 框 ， 它 用 于 显示 一 段 简单 的 消息 ， 并 伴 有 图 标 和 按钮 。 图 标的 样式 
取决 于 消息 的 严重 程度 ， 它 可 以 是 常规 信息 、 警 告 或 其 他 的 关键 信息 。 

下 面 是 MessageBox 类 用 于 创建 和 显示 这 3 类 信息 的 静态 方法 : 
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#include «qmessagebox.h» 


int information (QWidget *parent, const QString &caption, const QString &text, 
int button0, int button1=0, int button2=0) 


int warning (QWidget *parent, const QString &caption, const QString &text, 
int button0, int buttonl, int button2«0) 
int critical (QWidget *parent, const QString &caption, const QString &text, 


int button0, int buttonl, int button2«0) 
QMessageBox 预 先 提供 了 一 系列 的 按钮 ， 它 们 与 上 述 静态 方法 的 返回 值 相对 应 ; 


O QMessageBo: 







U QMessageBox: 
O QMessageBo: 
U QMessageBox: : Ret ry: 
O QMessageBo: 
QMessageBox 的 一 个 典型 使 用 方法 如 下 所 示 
int result = QMessageBox: :information(this, 

"Engine Room Query", "Do you wish to engage the HyperDrive?', 


QMessageBox::Yes | QMessageBox::Default, 
QMessageBox::No | QMessageBox::Escape); 








switch (result) ( 
case QMessageBox: :Yes: 
hyperdrive-»engage(); 
break; 
case QMessageBox: :No: 
// do something else 
break; 


) 


你 将 按钮 代码 与 Default 和 Escape 做 或 (1) 运算 ， 是 为 了 设置 键盘 上 的 Enter 键 和 Esc 键 被 按 下 时 
的 默认 动作 。 最 终 的 对 话 框 如 图 17-8 所 示 。 








17.5.3 QInputDialog 

QInputDialog 用 于 输入 单 值 数据 ， 它 可 以 是 文本 、 一 个 下 拉 列 表 中 的 选项 、 一 个 整数 或 一 个 浮 
点 数 。QInputDialog 类 有 与 QMessageBox 类 似 的 静态 方法 ， 不 过 更 复杂 一 点 ， 因 为 它们 有 许多 参数 ， 
但 好 在 大 多 数 参数 都 有 默认 值 。 


#include <qinputdialog.h> 


QString getText (const QString &caption, const QString &label, 
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QLineEdit::EchoMode mode=QLineEdit::Normal, 
const QString &text-QString::null, bool * ok = 0, 
QWidget * parent = 0, const char * name = 0) 


QString getItem (const QString &caption, const QString &label, 
const QStringList &list, int current-0, bool editable-TRUE, 
bool * ok-0, QWidget *parent = 0, const char *namez0) 


int getInteger (const QString &caption, const QString &label, int num=0, 
int from = -2147483647, int to = 2147483647, int step = 1, 
bool * ok = 0, QWidget * parent = 0, const char * name = 0) 


double getDouble (const QString &caption, const QString &label, double num = 0, 
double from = -2147483647, double to = 2147483647, 
int decimals = 1, bool * ok = 0, QWidget * parent = 0, 
const char * name = 0 ) 


如 果 要 输入 一 行文 本 ， 你 可 以 这 样 编写 代码 : 
bool result; 
QString text = QInputDialog:igetText(*Question", "What is your Quest?:", 


QLineEdit::Normal, 
QString::null, &result, this, "input" ); 





if (result) ( 
doSomething(text) ; 

) else ( 

// user pressed cancel 

) 


QInputDialog 由 一 个 QLineEGit 构 件 和 OK、Cancel 按 钮 组 成 ， 见 图 17-9。 




















图 17-9 
由 QInputDialog: :getText 创 建 的 对 话 框 使 用 了 一 个 QLinepGit 构 件 。 你 传递 给 getText 函 数 的 


编辑 模式 参数 用 于 控制 如 何 将 文本 回 显 给 用 户 ， 这 与 OLinesdit 构 件 中 同一 模式 的 作用 完全 相同 。 你 

还 可 以 设置 默认 的 文本 或 像 上 面 那 样 将 它 设置 为 空 。 每 个 QInputDialog 都 有 ok 和 cancel 按 钮 ， 它 传 

递 一 个 布尔 值 指针 给 该 方法 以 表明 哪个 按钮 被 按 下 。 如 果 用 户 按 下 OK 按钮 ， 那 么 result 将 为 TRUE。 
getItem 通 过 QcomboBox 向 用 户 提供 一 个 选项 列表 : 


bool result; 
OStringbiet eptionay 
options << "London" << "New York" << "Paris"; 
QString city = QInputDialog::getItem(*Holiday', "Please select a destination: ", 
options, 1, TRUE, &result, this, “combo"); 








if (result) 
selectDestination (city); 


生成 的 对 话 框 见 图 17-10。 
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Please select a destination: 


























图 17-10 
get Integer 和 getDouble 的 工作 方式 都 类 似 ， 我 们 在 这 里 就 不 展开 讲 了 。 
17.5.4 使 用 qmake 简化 makefile 文件 的 编写 


编译 使 用 KDE 库 和 Qt 库 的 应 用 程序 相当 繁琐 , 因为 你 的 makefile 文 件 变 得 非常 复杂 , 它 需要 使 用 
noc, 并 且 到 处 都 要 用 到 库 ,幸运 的 是 , Qt 自 带 了 一 个 被 称 为 amake 的 工具 , 它 可 以 帮助 你 创建 mnakefile 
文件 。 


如 果 以 前 使 用 过 Qt ,你 可 能 会 对 工具 make 比 较 熟 悉 ， 它 是 较 早 版 本 的 Qt 自 带 的 一 个 早期 
的 、 类 似 qmake 的 工具 (现在 已 不 用 )。 


qmake 以 .pro 文 件 作为 输入 。 这 个 文件 包含 了 编译 所 需 的 最 基本 信息 ， 如 源 文件 、 头 文件 、 目 标 

- 进 制 文件 和 KDE/Qt 库 的 位 置 。 
-个 典型 的 KDE .pro 文 件 如 下 所 示 : 

TARGET = app 

MOC_DIR = moc 

OBJECTS_DIR = obj 

INCLUDEPATH = /usr/include/kde 

QMAKE_LIBDIR_X11 += /usr/lib 

QMAKE_LIBS_X11 += -lkdeui -lkdecore 

SOURCES = main.cpp window. cpp 

HEADERS = window.h 


你 指定 了 目标 二 进 制 文件 、 临 时 的 moc 和 目标 目录 、KDE 库 路 径 、 要 编译 的 源 文件 和 头 文件 。 注 
意 ，KDE 头 文件 和 库 文 件 的 目录 取决 于 你 所 使 用 的 Linux 发 行 版 。SUSE 用 户 要 把 INCLUDEPATH 设 置 为 
/opt/kde3/include，QMAKE_LIBDIR_X11 设 置 为 /opc/kde3/1ib。 

$ qmake file.pro -o Makefile 

接 下 来 ， 你 就 可 以 像 通常 一 样 运行 make， 就 这 么 简单 。 对 于 任何 复杂 程度 的 KDE/Qt 程 序 来 说 ， 
你 都 应 该 使 用 gmake 来 简化 编译 过 程 。 


17.6 KDE 的 菜单 和 工具 栏 


为 了 展示 KDE 构 件 的 强大 功能 ， 我 们 把 菜单 和 工具 栏 留 到 最 后 来 讲 ， 因 为 它们 非常 好 地 说 明了 ， 
相 比 使 用 Qt 或 其 他 图 形 用 户 界面 工具 包 ，KDE 库 是 如 何 节省 时 间 和 精力 的 。 

通常 在 GUI 库 中 ， 菜 单项 和 工具 栏 项 是 不 同 的 元 素 ， 它 们 各 有 各 的 构件 。 你 必须 分 别针 对 它们 创 
建 对 象 并 跟踪 其 变化 ， 例 如 单独 禁用 某 一 项 。 

KDE 程 序 员 提出 了 一 个 更 好 的 解决 方案 。 与 使 用 分 开 解决 的 方法 不 同 ，KDE 定 义 了 一 个 Kaction 
构件 来 代表 应 用 程序 可 以 执行 的 动作 。 这 个 动作 可 以 是 打开 新 文档 、 保 存 文 件 或 显示 帮助 窗口 等 。 

创建 Kaction 时 ， 向 它 传递 一 个 文本 、 人 快捷 键 、 图 标 和 槽 (kAction 被 激活 时 调用 ): 
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KAction *new file = new KAction(*New*, "filenew', 
KstdAccel: :shortcut (KstdAccel : :New) , 
this, SLOT(newFile()), this, "newaction*); 


然后 ，KAction 可 以 在 不 加 任何 其 他 描述 的 情况 下 插入 到 菜单 和 工具 栏 中 : 
new file-»plug(a menu); 

new. file-»plug(a toolbar); 

这 样 你 就 创建 了 一 个 New 菜 单 和 工具 栏 项 。 在 它 被 点 击 时 ， 将 调用 newFile。 
如 果 你 想 禁用 KAction， 比 如 说 你 不 想 让 用 户 创建 新 文件 ， 只 需 下 面 一 行 代码 : 


new. file-»setEnabled(FALSE) ; 


这 就 是 KDE 菜 单 和 工具 栏 的 所 有 内 容 ， 的 确 很 简单 。 下 面 看 一 下 KAction 的 构造 函数 : 
#include «kde/kaction.h» 


KAction (const QString &text, const KShortcut &cut, const QObject *receiver, 

Const char *slot, QObject *parent, const char *name = 0) 
KDE 提 供 了 标准 的 KAction 对 象 ， 这 确保 了 文本 、 图 标 和 快捷 键 在 所 有 KDE 应 用 程序 中 都 是 一 样 的 ; 
#include «kde/kaction.h» 


KAction * openNew (const QObject *recvr, const char *slot, 
KActionCollection* parent, 
const char *name = 0 ) 
KAction 
KAction 
KAction 
KAction 
XAction 
etc... 
每 个 标准 动作 都 使 用 相同 的 参数 : MARA, —  RActionCollectionX[ f HIKAct ion 
名 字 。KActionCollection 对 象 管理 窗口 中 的 KkAction， 你 可 以 通过 调用 KMainwindow 的 action- 
collection 方 法 来 得 到 当前 对 象 : 
KAction *saveas = KStdAction::saveAs(this, SLOT(saveAs()), actionCollection(), 
"saveas*); 


实验 | | 一 个 带 有 菜单 和 工具 栏 的 KDE 应 用 程序 


你 将 在 下 面 这 个 例子 中 尝试 在 KDE 应 用 程序 中 使 用 KAction。 

(1) 首先 ， 从 头 文件 KpEMenu.h 开 始 。KDEMenu 是 KMainwindow 的 子 类 ，KMainwindow 本 身 又 是 
QMainwindow 的 子 类 。KMainwindow 在 KDE 中 处 理会 话 管理 ， 它 集成 了 工具 栏 和 状态 栏 。 

#include <kde/kmainwindow.h> 





class KDEMenu : public KMainWindow 
H 
Q.OBJECT 


public: 
KDEMenu(const char * name - 0); 


622 第 17 章 用 Qt 进行 KDE 编程 





private slots: 
void newFile(); 
void aboutApp(); 
a 


(2) 在 KpEMenu.cpp 中 ， 第 一 行 的 #include 语 句 用 于 包括 你 将 使 用 的 构件 声明 ; 
#include "KDEMenu.h* 


#include «kde/kapp.h» 
#include «kde/kaction.h» 
#include «kde/kstdaccel.h» 
#include «kde/kmenubar.h» — - 
Winclude «kde/kaboutdialog.h» 


(3) 在 构造 函数 中 ， 你 创建 了 3 个 KAction 构 件 。new_file 以 手工 定义 的 方式 创建 ，quit_action 
和 help_action 使 用 标准 的 KAction 定 义 : 


KDEMenu::KDEMenu(const char *name = 0) : KMainWindow (0L, name.) 
( 
KAction *new file = new KAction(*New', 'filenew', 
KstdAccel: :shortcut (KstdAcce: 
this, SLOT(newFile()), this, 





KAction *quit action = KStdAction::quit(KApplication::kApplication(), 
SLOT(quit()), actionCollection(]]); 


KAction *help action = KStdAction::aboutApp(this, SLOT(aboutApp()), 
actionCollection()); 


(4) 创建 两 个 顶层 菜单 ， 并 把 它们 插入 到 kApplication 菜 单 栏 中 : 


QPopupMenu *file menu = new QPopupMenu; 
QPopupMenu *help menu = new QPopupMenu; 





menuBar()-»insertItem(*&File*, file menu); 
menuBar()-»insertItem(*&Help', help menu); 


(5) 现在 ， 在 菜单 和 工具 栏 中 插入 动作 ， 并 在 new_file 和 auit_accion 之 间 插入 一 个 分 隔 线 ; 


new file-»plug(file menu); 

file menu-»insertSeparator(); 
quit. action-»plug(file menu); 
help action-»plug(help menu); 


new, file-»plug(toolBar()); 
quit action-»plug(toolBar()]; 
) 


(6) 最 后 是 一 些 横 定 义 ，aboutApp 创 建 一 个 KAbout 对 话 框 来 显示 程序 相关 信息 。 PX. quic 
作为 KApplication 的 一 部 分 来 定义 的 : 


void KDEMenu: :newFile() 
t 

// Create new File 
) 
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void KDEMenu: :aboutApp() 
t 
KAboutDialog *about = new KAboutDialog(this, "dialog"); 
about-»setAuthor(QString(*A. N. Author"), QStr: Gemail .net"), 
QSstring{"http://url.com"), QString("work")); 
about-»setVersion(*1.0*); 
about-»show(); 








H 
int main(int argc, char **argv) 


KApplication app( argc, argv, 'cdapp* 
KDEMenu *window = new KDEMenu("kdemenu*); 





app.setMainWidget (window); 
window-»show(); 


return app.exec(); 


) 
(7) 接 下 来 ， 你 需要 为 qmake 创 建 一 个 menu.pro 文 件 : 


TARGET = kdemenu 

MOC_DIR = moc 

OBJECTS DIR = obj 

INCLUDEPATH = /usr/include/kde 
QMAKE LIBDIR Xll += -LSKDEDIR/lib 
QMAKE LIBS X11 += -lkdeui -lkdecore 
SOURCES = KDEMenu.cpp 

HEADERS = KDEMenu.h 


(8) 运行 amake 来 创建 Makefile， 然 后 
$ qmake menu.pro -o Makefile 


$ make 
$ ./kdemenu 


虽然 这 个 例子 看 上 去 比 其 他 例子 要 长 ， 但 其 创建 菜单 栏 和 菜单 的 代码 还 是 相对 比较 简洁 的 。 
KAction 构 件 的 好 处 是 ， 你 可 以 在 多 个 地 方 使 用 它 ， 如 在 工具 栏 中 和 在 菜单 栏 上 的 菜单 中 ， 这 些 都 在 
这 个 例子 中 有 所 表现 。 

编译 KDE 应 用 程序 所 需 的 工作 量 比 编译 其 他 大 多 数 程 序 都 要 多 ， 至 少 乍 一 看 是 这 样 。 但 事实 上 ， 
menu .pro 文 件 和 amake 命 令 已 隐藏 了 大 量 的 设置 ， 否 则 你 必须 在 makefile 文 件 中 手工 进行 这 些 设置 。 

图 17-11 和 图 17-12 显 示 了 窗口 中 菜单 和 工具 栏 按钮 的 外 观 。 





译 和 运行 。 





图 17-12 
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至 此 ， 我 们 已 经 学 习 完了 Qt 和 KDE， 并 且 介绍 了 GUI 应 用 程序 的 基本 元 素 ， 包 括 窗口 、 布 局 、 按 
钮 、 对 话 框 和 菜单 。 但 还 有 许多 Qt 和 KDE 构 件 未 介绍 ， 如 ocolorpialog (颜色 选取 对 话 框 )、KHTML 
〈《Web 浏 览 器 构件 ) 等 ， 它 们 在 Trolltech 和 KDE 的 网 站 上 都 有 详细 的 文档 介绍 。 





17.7 ”使 用 KDE/Qt 编 写 CD 数据 库 应 用 程序 


让 我 们 再 次 把 注意 力 集中 到 CD 应 用 程序 上 来 ， 现 在 你 可 以 用 KDE/Qt 的 强大 功能 来 实现 它 了 。 你 
将 使 用 和 第 16 章 一 样 的 窗口 布局 ， 并 实现 类 似 的 功能 。 

先 回忆 一 下 你 想 让 CD 数据 库 应 用 程序 实现 的 功能 : 

O 通过 GUI 界 面 登 录 数 据 库 ; 

O 搜索 CD; 

O 显示 CD 和 曲目 信息 ; 

口 向 数据 库 中 添加 CD; 

O RR-A “KF” (About) 窗口 。 
17.7.1 run 


我 们 从 编写 应 用 程序 的 主 窗口 开始 ， 它 包含 搜索 输入 构件 和 搜索 结果 列表 。 

(1) 先 输入 Mainwindow.h 的 代码 〈 或 从 本 书 的 网 站 上 下 载 它 ) 。 因 为 窗口 包含 一 个 用 于 搜索 CD 
的 QLineEqit 构 件 和 一 个 用 于 显示 搜索 结果 的 QListview 构 件 ， 所 以 你 需要 包含 qlistview.h 和 
qlineedit .h 头 文件 : 

#include <kde/kmainwindow.h> 


#include <qlistview.h> 
#include «qlineedit.h» 





class MainWindow : public KMainWindow 
{ 
Q_oBIECT 


public: 
MainWindow (const char *name); 


public slots: 
void doSearch(); 
void AdáCd(); 


private: 
QListView *list; 
QLineEdit *search entry; 


(2) Mainwindow.cpp 是 这 个 程序 中 最 复杂 的 部 分 。 在 构造 函数 中 ， 你 创建 主 窗口 界面 并 将 必需 的 
信号 连接 到 槽 。 与 以 往 一 样 ， 从 #include 语 句 开 始 : 


#include "MainWindow.h* 
#include *AddCdDialog.h* 
#include "app mysql.h* 
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*include «qvbox.h» 
include «glineedit.h» 
include «qpushbutton.h» 
include «glabel.h» 
*include «qlistview.h» 
include «kde/kapp.h» 
#include «kde/kmenubar.h» 
finclude «kde/klocale.h» 
#include «kde/kpopupmenu.h» 
finclude «kde/kstatusbar.h» 
Winclude «kde/kaction.h» 
#include «kde/kstdaccel.h» 


finclude <string.h> 


MainWindow::MainWindow ( const char * name ) : KMainWindow ( OL, name ) 
t 


setCaption(*CD Database"); 
(3) 现在 用 Kaction 构 件 创建 菜单 和 工具 栏 项 : 
KAction *addcd action = new KAction(*&Add CD", 'filenew', 








KStdAccel: :shortcut (KStdAccel : :New) , 
this, 
SLOT (AddCd()), 
this); 
KAction *quit action = KStdAction::quit(KApplication::kApplication(), 
SLOT(quit()), actionCollection()); 


QPopupMenu * filemenu = new QPopupMenu; 
QString about = ("CD App\n\n" 
"(C) 2007 Wrox Press\n" 
*email&email.comWn*); 


QPopupMenu *helpmenu = helpMenu (about) ; 
menuBar()-»insertItem( "&File*, filemenu); 
menuBar()-»insertItem(il8n(*&Help*), helpmenu); 


addcd action-»plug|(filemenu); 
filemenu-»insertSeparator();: 
quit action-»plug(filemenu); 





adácd, action-»plug(toolBar()); 
quit. action-»plug(toolBar()); 


(4) 为 了 寻求 变化 ， 你 用 QBox 布 局 构件 来 取代 通常 的 0Layout 类 : 
QVBox *vbox = new QVBox (this); 
QHBox *hbox - new QHBox (vbox); 


QLabel *label - new QLabel(hbox); 
label-»setText( "Search Text:" ); 
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Search entry = new QLineEdit ( hbox ); 
QPushButton *button = new QPushButton( "Search", hbox); 


(5) 接 下 来 是 QListview 构 件 ， 它 占据 了 窗口 的 大 部 分 区 域 。 然 后 ， 你 将 必需 的 信号 连接 到 
dosearch 横 ， 来 执行 CD 数据 库 查询 。 你 添加 一 条 空 信息 让 KMainwinGow 的 状态 栏 可 见 : 


list = new QListView( vbox, , OL); 
list-»setRootIsDecorated|TRUE) ; 
list-»addColumn|(*Title*); 
list->addColumn ("Artist"); 
list->addColumn ( "Catalogue" 








connect (button, SIGNAL (clicked()), this, SLOT (doSearch{))); 
connect(search entry , SIGNAL(returnPressed()), this, SLOT(doSearch())); 


statusBar()-»message(*"); 
setCentralWidget (vbox) ; 
resize (300,400); 

} 


(6) dosearch 档 是 应 用 程序 中 最 重要 的 部 分 。 它 读 取 搜索 字符 串 ， 提 取 所 有 匹配 的 CD 和 它们 的 曲 
目 。 其 多 辑 和 第 16 章 中 GNOME/GTK+ 的 aosearch 完 全 相同 。 


void MainWindow::doSearch() 
t 
Cd search st *cd res = new cd search st; 
current cd st *cd = new current cd st; 
Struct current tracks st ct; 
int resl, i, j, res2, res3; 
char track title[110]; 
char search text[100]; 
char statusBar text[200]; 
QListViewltem *cd item; 


strcpy (search_text, search entry-»text()); 

(7) 提取 匹配 CD 的 标识 ia)， 更 新 状态 栏 以 显示 搜索 结果 : 

resl = find cás(search text, cd res); 

sprintf(statusBar text, * Displaying td result(s) for search string ' $s '", 


resl, search text]; 
StatusBar()-»message(statusBar text); 


iz0; 
list-»clear(); 


(8) 对 每 个 ia， 取 得 CD 信息 ， 插 入 到 orListview 中 ， 并 获取 这 个 CD 的 所 有 曲目 : 


while (i < resi) ( 
res2 = get cd(cd res-»cd id[i], cd); 
cd item = new QListViewItem(list, cd-»title, cd-»artist name, cd-»catalogue); 


xes3 = get cd tracks(cd res-»cd id[ie*], &ct); 


177 使 用 KDE/Qt 编 写 CD 数据 库 应 用 程序 627 





5 人 
/* Populate the tree with the current cd's tracks */ 
while (j « res3) ( 


sprintf(track title, " Track &d. 
Strcat(track title, ct.track[je*]); 





j+1); 


new QListViewItem(cd item, track title); 
) 
) 
) 


(9) 当 addcd_accion 菜 单项 或 工具 栏 按钮 被 激活 时 ，aAdaca 模 将 被 调用 : 


void MainWindow: :AddCd() 

{ 
AddCdDialog *dialog = new AddCdDialog(this); 
dialog-»show(); 


) 





了 结果 见 图 17-13。 











17.7.2 Adácápialog 


要 向 数据 库 中 添加 CD， 你 需要 编写 一 个 对 话 框 ， 对 话 框 中 有 一 些 需要 输入 的 字段 。 

(1) 输入 以 下 代码 ， 将 它 命名 为 adadacapialog.h。 注意: AGdcdDialog 继 承 自 KDialogBase (一 个 
KDE 对 话 框 构件 )。 

#include «kde/kdialogbase.h» 

#include «qlineedit.h» 

class AddCdDialog : public KDialogBase 

{ 

Q_OBJECT 


public: 
AddcaDialog (QWidget *parent); 
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private: 
QLineEdit *artist_entry, *title entry, *catalogue entry; 


public slots: 
void okClicked(); 
a 


(2) {k F»KJ&aaacapialog.cpp. t fEokclickedifirh ill Hi T MySQL DM ffjaaa, cà: 


include "AddcaDialog.h* 
#include 'app mysql.h* 


include «qlayout.h» 
finclude «qlabel.h» 


AddcábDialog::AddCdDialog( QWidget *parent) 
: KDialogBase( parent, "AddCD*, false, *Add CD", 
KDialogBase::Ok|KDialogBase::Cancel, KDialogBase::Ok, true ) 





QWidget *widget = new QWidget(this); 
setMainWidget (widget); 


QOGridLayout *grid = new QGridLayout (widget,3,2,10, 5,'grid*); 





grid-»addWidget(new QLabel('Artist*, widget, "artistlabel"), 0, 0, 0); 
grid-»addWidget (new QLabel ("Title", widg: titlelabel*), 1, 0, 0); 
grid-»addWidget(new QLabel(*Catalogue*, widget, "cataloguelabel'), 2, 0, 0); 





artist entry = new QLineEdit( widget, "artist entry'); 
title entry = new QLineEdit( widget, "title entry*); 
Catalogue entry = new QLineEdit( widget, "catalogue entry"); 





grid-»addWidget(artist entry, 0,1, 0); 
grid-»addWidget(title entry, 1,1, 0); 
grid-»addWidget (catalogue entry, 2,1, 0); 


connect (this, SIGNAL(okClicked()), this, SLOT(okClicked())); 
) 


void AddCdDialog::okClicked(] 
{ 

char artist[200]; 

char title[200]; 

char catalogue[200]; 

int cd id - 0; 


strcpy(artist, artist entry-»text()); 
strcpy(title, title entry-»text()); 
strcpy(catalogue, catalogue entry-»text(])); 
&dd cd(artist, title, catalogue, &cd id); 
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图 17-14 显 示 了 aadcapialog 的 运行 结果 。 











17.7.3 LogonDialog 

当然 ， 你 在 没有 登录 数据 库 的 情况 下 是 不 能 查询 它 的 ， 所 以 你 需要 一 个 简单 的 对 话 框 来 输入 登录 
信息 。 我 们 将 这 个 类 称 为 Logonpialog。 

(D 首 文件 LogonDialog.h。 注 意 ; 为 了 寻求 变化 , 这 里 继承 类 QDialog 而 不 是 kDialogBase。 


#include «qdialog.h» 
#include <qlineedit.h> 





class LogonDialog : public QDialog 
t 
QLOBJECT 


public: 
LogonDialog (QWidget *parent = 0, const char *name = 0); 
QString getUsername(); 
QString getPassword(); 


private: 
QLineEdit *username entry, *password entry; 


X 
(2) 这 次 ， 你 有 更 好 的 方法 来 管理 用 户 名 和 密码 ， 而 不 是 在 Logonpialog.cpp 中 封装 daacabase_ 
start 调 用 ， 下 面 是 Logonpialog.cpp 的 代码 : 


#include "Logonbialog.h" 
#include "app mysql.h* 


include «qpushbutton.h» 
*include «qlayout.h» 
4#include «qlabel.h» 
LogonDialog::LogonDialog( QWidget *parent, const char *name): QDialog(parent, name) 
€ 
QGridLayout *grid = new QGridLayout(this, 3, 2, 10, 5,*grid*); 


grid-»addWidget(new QLabel(*Username*, this, *usernamelabel*), 0, 0, 0); 
grid-»addWidget(new QLabel(*Password', this, "passwordlabel*), 1, 0, 0); 
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username entry = new QLineEdit( this, "username_entry"); 
password entry = new QLineEdit( this, "password entry*); 
password entry-»setEchoMode (QLineEdit : : Password); 





grid->addWidget (username_entry, 0, 1, 0); 
grid-»addWidget(password entry, 1, 1, 0); 


QPushButton *button = new QPushButton ("Ok*, this, "button"); 
grid-»addWidget(button, 2, 1,Qt::AlignRight); 


connect (button, SIGNAL(clicked()), this, SLOT(accept())); 
) 
QString LogonDialog::getUsername(|) 
à if (username entry == NULL) 
return NULL; 


return username entry-»text(); 


) 


letPassword() 





QString LogonDialog 
{ 


if (password_entry == NULL) 
return NULL; 


return password entry-»text(); 
) 


其 运行 结果 见 图 17-15。 





17.7.4 main.cpp 


现在 只 剩 下 main 函 数 未 编写 了 ， 你 把 它 放 在 一 个 单独 的 源 文件 main.cpp 中 。 

(1) 在 main.cpp 中 , 你 先 打开 一 个 Logonpialog, 然后 通过 aatabase_scart 登 录 。 如 果 登 录 失败 ， 
就 将 显示 一 个 QMessageBox， 或 者 如 果 用 户 想 退 出 LogonDialog， 就 将 询问 用 户 是 否 确定 要 退出 。 

#include "MainWindow.h* 


#include "app_mysql.h" 
#include *LogonDialog.h* 


#include <kde/kapp.h> 
#include <qmessagebox.h> 
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int main( int argc, char **argv ) 


€ 


) 


char username[100]; 
char password[100]; 


KApplication a( argc, argv, "cdapp* ); 
Logonbialog *dialog = new LogonDialog(); 


while (1) 
{ 
if (dialog-»exec() == QDialog::Accepted) 
{ 
strcpy (username, dialog->getUsername()); 
strcpy (password, dialog-»getPassword()); 


if (database_start (username, password) ) 
break; 


QMessageBox::information(0, "Title" 





*Could not Logon: Check username and/or password", 


QMessageBox: :Ok) ; 
continue; 
J 
else 


{ 
if (QMessageBox::information(0, "Title", 
"Are you sure you want to quit 





delete dialog; 


MainWindow *window = new MainWindow( "Cd App" ); 
window-»resize( 600, 400 ); 


a.setMainWidget( window ); 
window-»show(); 


return a.exec(); 


(2) 剩 下 的 就 是 编写 .pro 文 件 ， 并 将 它 传递 给 qmake。 这 个 文件 名 为 cdapp .pro: 


TARGET = app 

MOC_DIR = moc 

OBJECTS DIR = obj 

INCLUDEPATH - /usr/include/kde /usr/include/mysql 
QMAKE LIBDIR Xll «- -/usr/lib 

QMAKE LIBDIR X11 += /usr/lib/mysql 
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QMAKE_LIBS_X11 += -lkdeui -lkdecore -lmysqlclient 


SOURCES = MainWindow.cpp main.cpp app_mysql.cpp AddCdDialog.cpp LogonDialog.cpp 
HEADERS = MainWindow.h app mysql.h AddCdDialog.h LogonDialog.h 





这 里 你 只 是 将 app_mysql.c 改 名 为 app_mysql .cpp， 这 样 它 将 被 看 做 为 一 个 普通 
的 C++ 源 文件 。 这 可 以 避免 将 C 语 言 的 目标 文件 链接 到 C++ 带 来 的 麻烦 。 


$ qmake cdapp.pro -o Makefile 
$ make 


$ ./app 

如 果 一 切 正常 ， 你 的 CD 数据 库 应 用 程序 就 制作 完成 了 ! 

你 可 能 想 尝试 用 MySQL 接 口 实现 其 他 功能 〔 如 向 CD 中 添加 曲目 或 删除 CD) ， 来 进一步 了 解 
KDE/Qt。 你 可 以 创建 对 话 框 、 新 的 菜单 项 和 工具 栏 项 ， 以 及 编写 底层 逻辑 。 尽 管 去 尝试 吧 ! 
17.8 小 结 


在 本 章 中 ， 你 学 习 了 如 何 使 用 Qt GUI 库 ， 并 看 到 了 KDE 构 件 的 使 用 情况 。 你 了 解 到 Qt 是 一 个 用 信 
号 / 档 机 制 来 实现 事件 驱动 编程 的 C++ 库 。 还 学 习 了 基本 的 Qt 构件 ， 并 且 编 写 了 一 些 示例 程序 ， 了 解 了 
如 何在 实际 情况 中 使 用 它们 。 最 后 ， 你 用 KDE/Qt 实 现 了 一 个 CD 应 用 程序 的 GUI 前 端 。 
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Linux 标 准 


| : 


inux 刚 开始 的 时 候 仅仅 只 是 一 个 内 核 ， 但 内 核 本 身 并 不 是 非常 有 用 。 我 们 还 需要 许多 其 他 有 用 

的 程序 ， 例 如 登录 系统 的 程序 、 管 理 文件 的 程序 、 编 译 器 等 。 为 了 使 Linux 系 统 变 得 更 加 有 用 ， 
许多 GNU 项 目的 工具 被 添加 进来 。 它们 都 是 当时 在 UNIX 和 类 UNIX 系 统 中 非常 流行 的 程序 的 克隆 版 
本 。 将 Linux 系 统 变 得 与 UNIX 非 常 相 似 设置 了 Linux 的 第 一 个 标准 ， 它 为 C 语 言 程 序 员 提 供 了 一 个 非常 
MEHR. 

不 同 的 UNIX〈 及 其 后 的 Linux) 厂商 为 他 们 所 提供 的 命令 和 工具 添加 了 一 些 专 有 的 扩展 ， 而 且 它 
们 所 使 用 的 文件 系统 布局 之 间 也 有 一 些 细微 的 差别 。 这 使 得 创建 可 以 在 多 个 系统 中 作 的 应 用 程 
序 变 得 很 困难 。 更 糖 的 是 ， 程 序 员 甚至 不 能 指望 不 同 的 系统 会 以 相同 的 方式 提供 系统 工具 或 配置 文件 
在 不 同 的 系统 中 都 位 于 同一 个 位 置 。 

很 显然 ， 我 们 必须 要 建立 一 些 标准 以 避免 UNIX 系 统 的 分 化 ， 目 前 已 经 完成 了 一 些 优秀 的 UNIX 标 
准 化 工作 。 

不 仅 这 些 标准 在 随 着 时 间 不 断 发 展 , 而 且 Linux 自 身 也 在 随 着 网 络 社区 (通常 由 商业 组 织 如 Red Hat 
和 Canonical, 甚至 包括 非 Linux 厂 商 如 IBM 所 支持 ) 的 推动 而 以 惊人 的 速度 不 断 增强 ,在 发 展 的 过 程 中 ， 
Linux 和 GCC 编译 器 集 不 仅 保持 与 相应 标准 的 一 致 ， 而 且 在 既 有 标准 不 满足 需要 时 ， 还 会 有 新 的 标准 
推出 。 事实 上 , 随 着 Linux 及 其 相关 工具 和 实用 程序 变 得 越 来 越 流行 ，UNIX 厂 商 已 开始 对 他 们 的 UNIX 
系统 做 出 修改 ， 以 使 它们 与 Linux 兼 容 性 更 好 。 

在 本 书 的 最 后 一 章 中 ， 我 们 将 介绍 这 些 标准 。 我 们 还 将 给 出 一 些 注意 事项 ， 以 便 让 你 编写 的 应 用 
程序 不 仅 可 以 在 自己 的 Linux 系 统 〈 包 括 以 后 的 升级 版 本 ) 中 运行 ， 而 且 可 以 移植 到 其 他 Linux 版 本 ， 
甚至 其 他 类 UNIX 系 统 中 ， 从 而 与 其 他 用 户 分 享 。 

我 们 将 主要 介绍 以 下 几 方面 内 容 。 

O C 编 程 语言 标准 。 

口 UNIX 标 准 , 特别 是 由 IEEE 开 发 的 POSIX 标 准 , 以 及 由 开放 组 织 (Open Group) 开发 的 单一 UNIX 

规范 。 

O 由 自由 标准 组 织 (Free Standard Group) 所 做 的 工作 ， 特 别 是 Linux 标 准 化 规范 〔Linux Standard 

Base)， 它 定义 了 标准 的 Linux 文 件 系统 布局 。 

了 解 Linux 相 关 标准 的 一 个 好 起 点 是 Linux 标 准 化 规范 (LSB)， 你 可 以 通过 访问 Linux 基 金 会 网 站 
http://www.linux-foundatjon.org 来 找到 它 。 

我 们 并 不 准备 详细 介绍 这 些 标准 的 内 容 ， 其 中 许多 标准 的 内 容 篇 幅 太 长 。 我 们 将 指出 一 些 关键 标 
准 ， 并 介绍 这 些 标准 发 展 的 历史 背景 ， 以 及 告诉 你 哪些 标准 对 你 有 用 。 
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18.1 C 编程 语言 


C 语 言 是 Linux 编 程 语言 事实 上 的 标准 ， 所 以 为 了 在 Linux 上 编写 可 移植 的 C 语 言 程序 ， 我 们 需要 了 
解 一 些 C 语 言 的 起 源 ， 它 是 如 何 发 展 的 ， 而 更 重要 的 是 如 何 检查 程序 来 保持 和 标准 的 一 致 。 

18.11 ”发展 历史 简介 

那些 对 历史 不 感 兴趣 的 读者 无 需 担心 ， 因 为 本 书 是 介绍 编程 ， 而 不 是 讲述 历史 ， 所 以 我 们 只 是 简 
单 介 绍 C 语 言 的 发 展 历史 。 

C 编 程 语言 诞生 于 20 世 纪 70 年 代 ， 它 部 分 基于 早先 的 编程 语言 BCPL， 并 对 B 语 言 进行 了 扩展 。 
Dennis M. Ritchie 在 1974 年 为 该 语言 写 了 一 个 参考 手册 ， 同 一 时 间 ， 对 PDP-11 机 器 上 的 UNIX 内 核 的 改 
写 也 是 以 C 语 言 为 基础 的 。1978 年 ，Brian W. Kernighan 和 Ritchie 写 了 一 本 经 典 的 C 语 言 参 考 书籍 《C 编 
程 语言 》(C Programming Language)， 其 后 该 书 又 针对 C 语 言 的 改进 做 了 更 新 ， 直 至 今日 ， 这 本 书 还 
在 不 断 地 重印 出 版 。 

C 语 言 如 此 快速 地 流行 起 来 ， 毫 无 疑问 这 里 面 有 部 分 原因 应 归功 于 UNIX 用 户 的 快速 增加 ， 但 也 与 
其 自身 强大 的 功能 和 清晰 的 语法 分 不 开 。C 语 言 的 语法 根据 开发 者 的 共识 也 在 不 断 发 展 ， 但 既然 它 与 
原先 参考 书籍 中 所 描述 的 语言 分 歧 越 来 越 大 ， 很 明显 我 们 需要 一 个 标准 ， 它 既 符合 当前 的 应 用 ， 又 更 
加 精确 。 

1983 年 ，ANSI 建 立 了 X3J11 标 准 委员 会 来 开发 一 个 清晰 、 简 明 的 C 语 言 定义 。 在 开发 的 过 程 中 ， 
他 们 对 C 语 言 做 了 稍 许 的 改进 ,特别 是 增加 了 一 个 非常 受 欢 迎 的 功能 一 一 声明 参数 类 型 ， 但 总 的 来 说 ， 
委员 会 只 对 构成 C 语 言 常见 用 法 的 已 有 定义 做 了 曾 明 和 合理 化 。 这 个 标准 最 终 在 1989 年 发 表 了 ， 它 被 
称 为 ANSI C 编 程 语言 标准 如 .159-1989， 或 简称 为 C89， 有 时 又 被 称 为 C90( 后 者 后 来 成 为 ISO C 编 程 语 
言 标准 ISO/IEC 9899:1990。 这 两 个 标准 在 技术 上 是 相同 的 )。 

如 同 大 多 数 标准 一 样 ， 这 个 标准 的 发 表 并 未 结束 委员 会 的 工作 ， 他 们 继续 努力 以 亲 明 在 规范 中 发 
现 的 小 的 差异 。1993 年 ， 委 员 会 又 开始 制定 下 一 个 版 本 的 标准 ， 即 C9X。 同 时 ， 他 们 还 针对 当前 的 标 
准 陆续 在 1994、1995 和 1996 年 发 表 了 小 的 修正 和 更 新 。 

这 个 标准 的 最 新 版 本 出 现在 20 世 纪 90 年 代 ， 它 正式 成 为 C99 标 准 并 被 ISO 采 纳 ， 成 为 ISO/IEC 
9899:1999。 目 前 还 有 一 个 工作 委员 会 JI1 在 继续 进行 C 语 言及 其 函数 库 的 标准 化 研究 ， 但 它 现在 是 
在 国际 委员 会 下 为 信息 技术 标准 组 工作 。 你 可 以 通过 网 址 http:Will.incits.org/ 找 到 更 多 有 关 当前 C 语 言 
标准 化 工作 的 信息 。 

18.1.2. GNU 编译 器 集 

开发 了 Emacs 编辑 器 〈 是 的 ， 我 们 爱 Emacs) 后 ，GNU 项 目的 下 一 个 主要 成 就 (正如 我 们 在 第 1 章 
讨论 的 ) 是 一 个 完全 免费 的 C 语 言 编译 器 gcc， 它 的 第 一 个 正式 版 本 发 表 于 1987 年 。 

gcc 最 初 只 是 一 个 GNU C 语 言 的 编译 器 ， 但 由 于 目前 该 编译 器 的 基本 框架 已 支持 CH+、Object-C、 
FORTRAN、Java 和 Ada 等 许多 其 他 编程 语言 及 其 函数 库 ， 所 以 对 gcc 的 定义 被 修改 为 更 合适 的 GNU 编 
译 器 集 。 

gcc 始 终 是 ， 并 且 看 来 以 后 也 将 会 是 Linux 上 的 标准 编译 器 ， 并 且 C 或 C+ 语言 也 是 Linux 上 程序 设 
计 的 基本 语言 。 更 多 信息 可 参见 gcc 的 主页 http://gcc.gnu.org。 

GNU C 语 言 编 译 器 总 是 非常 好 地 保持 与 C 语 言 标准 开发 进度 的 一 致 , 同时 它 也 允许 一 些 扩展 功能 ， 
并 且 不 可 避免 地 像 所 有 其 他 编译 器 一 样 ， 在 标准 正式 推出 和 编译 器 完全 实现 该 标准 之 间 有 稍微 的 延 
迟 。 但 有 时 也 会 出 现 相反 的 情况 ，gcc 期 望 标准 能 稍 作 一 些 修改 ， 这 一 点 也 让 人 非常 困惑 。gcc 包 含 许 
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多 命令 行 命令 和 选项 , 它们 允许 你 指定 希望 gcc 遵 守 的 C 语 言 标准 版 本 ,以 及 控制 编译 器 审查 程序 语法 
时 的 严格 程度 。 


18.1.3 gcc 选项 


在 了 解 了 一 些 C 语 言 标准 发 展 的 背景 之 后 ， 现 在 我 们 来 查看 gcc 编 译 器 提供 的 一 些 选项 ， 它 们 可 
以 用 来 确保 我 们 所 编写 的 C 语 言 程序 是 完全 遵守 该 语言 的 标准 的 ,我 们 可 以 用 3 种 方法 来 确保 编写 的 C 
语言 代码 不 仅 遵守 标准 ， 而 且 还 是 代码 清晰 的 。 它 们 是 : 用 可 以 控制 标准 版 本 的 选项 来 指定 我 们 期 
望 代码 兼容 的 标准 版 本 : 定义 用 来 控制 头 文件 的 常量 ， 用 警告 选项 对 代码 进行 更 严格 的 检查 。 

gcc 编 译 器 包含 有 大 量 的 选项 ， 在 这 里 ， 我 们 将 只 介绍 那些 最 重要 的 选项 。 完 整 的 选项 列表 可 以 
在 gcc 手 册页 中 找到 。 我 们 还 将 简单 介绍 一 些 可 以 使 用 的 #define 选 项 ， 它 们 通常 必须 在 源 代 码 中 的 
任何 #include 语 句 之 前 设置 或 在 gcc 命 令 行 上 定义 。 你 可 能 会 感到 惊讶 ， 为 什么 需要 用 这 么 多 选项 来 
选择 一 个 要 使 用 的 标准 ， 而 不 能 只 用 一 个 标记 来 强制 使 用 当前 的 标准 呢 ? 原因 是 ， 由 于 许多 以 前 的 程 
序 依赖 编译 器 的 历史 行为 ， 如 果 要 将 它们 全 部 更 新 到 遵守 最 新 的 标准 ， 我 们 需要 付出 巨大 的 努力 ， 并 
且 我 们 并 不 希望 编译 器 升级 以 后 就 不 再 支持 以 前 可 以 正常 工作 的 代码 ， 而 且 随 着 标准 的 发 展 ， 我 们 希 
望 编译 器 能 够 针对 特定 的 标准 正常 工作 ， 即 使 它 并 不 是 最 新 版 本 的 标准 。 

即使 仅仅 是 为 个 人 使 用 而 编写 一 个 小 的 程序 ， 在 这 种 情况 下 ， 虽 然 让 程序 遵守 标准 显得 并 不 是 那 
么 重要 ， 但 仍然 值得 在 编译 时 启用 更 多 的 gcc 警 告 选项 ， 因 为 这 样 可 以 让 编译 器 在 真正 运行 程序 之 前 
找 出 程序 代码 中 的 错误 。 与 使 用 调试 器 以 步 进 的 方式 来 查找 代码 问题 相 比 ， 使 用 这 种 方式 更 有 效率 。 
编译 器 包括 很 多 选项 ， 它 们 的 功能 不 仅仅 只 是 检查 代码 是 否 遵守 标准 的 规定 ， 而 且 还 可 以 检查 出 虽然 
遵守 标准 但 可 能 包含 歧义 的 代码 。 例 如 ， 代 码 中 可 能 存在 一 个 执行 序列 ， 它 将 允许 变量 在 未 初始 化 之 
前 就 被 访问 。 

如 果 确 实 需 要 将 编写 的 代码 与 他 人 分 享 ， 除了 在 编译 时 选择 需要 遵守 的 标准 版 本 和 合适 的 警告 选 
项 外 ， 还 有 非常 重要 的 一 点 是 ， 要 努力 确保 你 的 代码 在 编译 时 没有 任何 警告 信息 出 现 。 如 果 你 在 
时 允许 出 现 一 些 警告 信息 并 且 养 成 习惯 忽略 它们 ， 那 么 当 有 一 天 在 编译 时 出 现 非常 严重 的 警告 信 
时 ， 你 也 可 能 会 把 它 忽略 。 如 果 代 码 在 编译 时 永远 都 保持 整洁 ， 那 么 当 出 现 新 的 警告 信息 时 ， 它 就 会 
显得 非常 明显 。 我 们 应 该 养 成 保持 编译 代码 整洁 的 习惯 。 

1. 控制 标准 版 本 的 编译 选项 

这 些 选项 在 命令 行 上 传递 给 gcc。 我 们 只 在 下 面 讲解 那些 最 重要 的 选项 。 

口 -ansi: 这 是 最 重要 的 标准 选项 ， 它 告诉 编译 器 遵守 C 语 言 的 ISO C90 标 准 。 它 关闭 那些 与 标准 

不 兼容 的 gcc 扩 展 ， 禁 用 C 语 言 程序 中 的 C++ (7) 风格 注释 ， 并 启用 ANSI 的 三 字母 词 (trigraph) 
特性 。 同 时 通过 定义 宏 _ STRICT_ANSI_ 来 关闭 在 头 文件 中 与 标准 不 兼容 的 一 些 gcc 扩 展 。 未 
来 的 编译 器 版 本 可 能 会 修改 这 个 选项 指向 的 C 语 言 标准 。 

U -st 过 这 个 选项 可 以 对 使 用 的 标准 进行 更 精细 地 控制 ， 它 通过 使 用 一 个 参数 来 设置 需要 

的 标准 。 其 主要 的 选项 如 下 所 示 。 
m c89: 支持 C89 标 准 。 
m is09899:1999: 支持 最 新 的 ISO C90 标 准 。 
m gnu89: 支持 C89 标 准 ， 但 同时 支持 GNU 的 扩展 和 一 些 C99 特 性 。 对 于 gcc 的 4.2 版 本 来 说 ,这 
是 默认 行为 。 
2. 控制 标准 版 本 的 常量 
这 些 常量 (#define) 可 以 通过 编译 器 的 命令 行 选项 来 设置 ， 或 者 通过 源 代码 中 的 #define 语 句 
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来 定义 。 我 们 通常 建议 用 前 者 设置 这 些 常量 。 
O 一 STRICT_ANTI_: 强制 使 用 C 语 言 的 ISO 标准 。 这 个 常量 在 使 用 编译 器 的 命令 行 选 项 -ansi 
时 被 定义 。 
O _POSIX_C_SOURCE=2: 启用 由 IEEE Std 1003.1 和 1003.2 标 准 定义 的 特性 。 我 们 还 会 在 本 章 后 面 
的 内 容 中 谈 到 这 些 标准 。 
O _BSD_SOURCE: 启用 BSD 类 型 的 特性 。 如 果 这 些 特性 与 POSIX 定 义 冲突 ， 则 以 BSD 的 定义 为 
HE. 
口 -SNU_soURCE: 启用 大 量 特性 ， 其 中 包括 GNU 扩 展 。 如 果 这 些 特性 与 POSIX 定 义 冲突 ， 则 以 
POSIX 定 义 为 准 。 
3. 编译 器 的 警告 选项 
这 些 选项 在 编译 器 的 命令 行 上 传递 。 我 们 在 下 面 只 列 出 主要 的 选项 。 完 整 的 选项 列表 可 以 在 gcc 
的 手册 页 中 找到 。 
O -pedantic: 这 是 用 于 检查 C 语 言 代码 的 功能 最 强大 的 编译 器 选项 。 它 除了 启用 用 于 检查 代码 
是 否 遵守 C 语 言 标准 的 选项 外 ， 还 关闭 了 一 些 不 被 标准 允许 的 传统 C 语 言 结构 ， 并 且 禁 用 所 有 
的 GNU 扩 展 。 如 果 你 希望 代码 能 够 尽 可 能 地 做 到 可 移植 ， 就 需要 使 用 这 个 选项 。 这 个 选项 的 
缺点 是 ， 它 在 检查 代码 时 显得 非常 挑 吻 ， 有 时 你 不 得 不 非常 仔细 地 思考 ， 以 去 除 那些 最 后 的 
警告 信息 。 
口 -wformat: 检查 printf 系 列 函 数 所 使 用 的 参数 类 型 是 否 正确 。 
O -wparentheses: 检查 是 可 总 是 提供 了 需要 的 圆 括号 ， 即 使 在 某 些 环境 中 并 不 是 必须 要 使 用 
它们 。 当 想 要 检查 对 一 个 复杂 结构 的 初始 化 是 否 按照 预期 进行 时 ， 这 个 选项 就 很 用。 
口 -wswitch-default: 检查 是 否 所 有 的 switch 语 句 都 包含 一 个 default case， 这 通常 是 一 个 
好 的 编码 习惯 。 
O -wunused: 检查 诸如 声明 静态 函数 但 没有 定义 、 未 使 用 的 参数 和 丢弃 返回 结果 等 情况 。 
O -wall: 启用 绝 大 多 数 gcc 的 警告 选项 , 包括 所 有 以 -w 为 前 缀 的 选项 (不 包括 选项 -pedantic)， 
这 个 选项 对 保持 代码 的 整洁 很 有 用 。 
gcc 还 包括 许多 警告 选项 ， 详 细 情 况 请 阅读 gcc 的 网 页 .一 般 来 说 ， 我 们 建议 使 用 选项 
-Wall， 它 在 检查 代码 质量 和 不 让 编译 器 生成 太 多 的 琐碎 警告 之 间 达 到 了 很 好 的 平衡 ， 因 为 
要 清除 掉 这 些 正 碎 的 警告 需要 耗费 程序 员 太 多 的 精力 。 


18.2 接口 和 LSB 


现在 我 们 将 讨论 比 C 语 言 代 码 高 一 个 层次 的 由 操作 系统 提供 的 接口 (系统 函数 )。 这 一 级 别 的 标准 
化 工作 由 下 面 两 个 组 件 构成 : 由 函数 库 提供 的 函数 和 由 底层 的 操作 系统 提供 的 系统 调用 。 在 这 两 个 组 
件 之 中 又 分 别 包含 两 个 层次 的 细节 : 提供 的 是 哪 一 个 接口 和 接口 的 定义 。 

在 这 一 领域 的 针对 Linux 的 权威 性 文档 是 LSB， 你 可 以 在 http:/wwwlinuxbase.org 或 http://www. 
linux-foundation.org/en/LSB 上 找到 它 。 该 标准 已 发 布 了 多 个 版 本 ， 其 工作 还 正在 进行 之 中 。 

你 可 以 在 http://www.linux-foundation.org/en/products 上 找到 通过 验证 的 Linux 发 行 版 列表 .。 Red Hat, 
SUSE 和 Ubuntu 的 各 种 版 本 都 通过 了 验证 ， 但 请 记 住 ， 一 个 发 行 版 在 发 布 之 后 需要 经 过 一 段 时 间 的 测 
试 来 通过 验证 。 这 个 站 点 还 列 出 了 正 处 于 测试 中 的 发 行 版 ， 以 及 需要 进行 一 些 更 新 才能 通过 验证 测试 
的 发 行 版 。 
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Linux 标 准 化 规范 〈 版 本 3.1) 定义 了 3 个 需要 遵守 的 领域 。 

口 核心 : 主要 的 函数 库 、 工 具 和 一 些 重要 的 文件 系统 位 置 。 

口 C++: C++ 函数 库 。 

OQ 桌面 : 用 于 桌面 安装 的 其 他 文件 ， 主 要 是 各 种 图 形 库 。 

我 们 感 兴趣 的 主要 领域 是 这 个 规范 的 核心 部 分 。 

LSB 规 范 在 其 自身 的 文档 中 涵盖 了 许多 领域 ,同时 它 还 引用 了 一 些 针对 特定 接口 定义 的 外 部 标准 。 
其 涵盖 的 领域 包括 : 

O 可 兼容 二 进 制程 序 的 对 象 格式 ; 

口 动态 链接 标准 ; 

口 标准 函数 库 ， 包 括 基础 函数 库 和 X 视 窗 系统 函数 库 ; 

口 shell 和 其 他 命令 行程 序 ; 

口 执行 环境 ， 包 括 用 户 和 组 ; 

口 系统 初始 化 和 运行 级 别 。 

在 本 章 中 ， 我 们 只 对 标准 函数 库 、 用 户 和 系统 初始 化 感 兴趣 ， 所 以 这 也 是 下 面 将 要 介绍 的 内 容 。 


18.2.1 LSB 标准 函数 库 


LSB 定 义 了 必须 以 两 种 方式 呈现 的 接口 ,对 于 那些 主要 是 由 GNU C 函 数 库 实现 的 或 试图 成 为 Linux 
专属 标准 的 函数 ， 它 定义 接口 及 其 行为 。 对 于 主要 来 自 UNIX 系 统 的 其 他 接口 ， 规 范 只 是 说 明 必须 存 
在 一 个 特定 接口 ， 并 且 该 接口 的 行为 必须 与 其 他 标准 定义 的 一 样 ， 这 里 所 说 的 其 他 标准 通常 指 的 是 公 
共 应 用 环境 (Common Application Environment, CAE) 或 更 常见 的 单一 UNIX 规 范 (Single UNIX 
Specification )。 后 者 的 网 址 为 http://www.opengroup.org， 其 中 一 部 分 内 容 可 以 通过 http://www. 
unix.org/online.html (需要 注册 ) 访问 。 

但 遗憾 的 是 ，Linux 的 底层 标准 ， 即 UNIX 标 准 的 历史 非常 复杂 ， 存 在 相当 多 的 标准 可 供 选 择 ， 虽 
然 其 中 大 部 分 标准 的 不 同 版 本 之 间 的 兼容 性 都 很 好 。 

1. UNIX 标 准 历史 简介 

UNIX 诞 生 在 20 世 纪 60 年 代 末 的 AT&T 公 司 的 贝尔 实验 室 。 最 初 ，Ken Thompson 和 Dennis Ritchie 
只 是 处 于 个 人 使 用 的 目的 编写 了 一 个 操作 系统 并 将 其 命名 为 Unics, 不 知 何故 这 个 名 字 后 来 又 被 更 名 为 
UNIX。AT&T 公 司 允 许 大 学 获取 该 操作 系统 的 源 代码 来 进行 研究 ， 并 且 由 于 UNIX 非 常 整洁 的 设计 和 
强大 的 概念 ， 它 很 快 就 变 得 非常 流行 。 开 放 源 代码 也 产生 了 非常 重大 的 意义 ， 因 为 它 允 许 人 们 对 其 进 
行 修改 和 实验 。 

BSD 操 作 系统 作为 UNIX 系 统 的 一 个 分 支 ， 由 加 州 大 学 伯克利 分 校 开 发 ， 其 中 的 许多 工作 主要 集 
中 在 操作 系统 的 网 络 功能 上 。 

当 AT&T 公 司 在 20 世 纪 80 年 代 中 期 开始 将 UNIX 系 统 商业 化 时 ， 它 对 其 发 布 的 UNIX 系 统 进行 了 命 
名 ， 其 中 最 流行 的 一 个 版 本 是 UNIX System V. 

与 此 同时 ， 也 出 现 了 许多 其 他 的 UNIX 分 支 ， 数 量 太 多 ， 我 们 就 不 在 这 里 一 一 列 出 了 。 这 些 UNIX 
分 支 都 与 UNIX 基 本 的 标准 有 些 细微 的 区 别 并 增加 了 一 些 功能 ， 因 为 公司 一 般 都 会 尝试 通过 私有 扩展 
来 增加 操作 系统 的 功能 。 

1994 年 ， 当 AT&T 决 定 退 出 UNIX 产 业 并 将 它 的 UNIX 系 统 实验 室 卖 给 Novell 公 司 之 后 , 情况 开始 变 
得 真正 复杂 起 来 ，UNIX 商 标的 所 有 权 变 得 有 些 混乱 ， 并 成 为 了 各 种 诉讼 案件 的 主题 。 

1988 年 , IEEE(http://www.ieee.org) 发 表 了 一 系列 UNIX 标 准 中 的 第 一 个 标准 POSIX( 又 被 称 为 IEEE 








638 第 18 章 Linux 标准 





1003 标 准 )， 它 试图 成 为 权威 性 的 针对 计算 机 环境 的 可 移植 接口 规范 。 虽 然 它 是 一 个 好 的 、 定 义 明确 
的 标准 ， 但 同时 它 也 是 一 个 非常 核心 的 规范 并 且 它 所 涵盖 的 范围 也 非常 有 限 。 

1994 年 ，X/OPEN 公 司 作为 一 个 厂商 中 立 的 机 构 ， 发 表 了 一 组 较 大 规模 的 规范 WOPEN CAE (又 被 
称 为 公共 应 用 环境 )， 它 是 IEEE POSIX 标 准 的 一 个 超 集 并 且 从 技术 角度 来 说 有 很 多 领域 与 它 相 同 。 
XOPEN 公 司 后 来 和 OSF 合 并 成 立 了 Open Group， 它 的 网 址 是 http:/www.opengroup.org/。CAE 标 准 在 
2002 年 被 更 新 并 以 单一 UNIX 规 范 版 本 3 的 形式 由 Open Group 发 表 。 

单一 UNIX 规 范 是 Linux 标 准 化 规范 最 常 参考 的 一 个 规范 。 

注意 ，“Linux” 是 一 个 由 Linus Torvalds 拥 有 的 商标 ( 见 http://www.linuxmark.org/)。 


2. 针对 函数 库 使 用 LSB 标 准 

上 一 节 的 介绍 对 读者 了 解 UNIX 标 准 的 历史 已 经 足够 ， 但 这 对 那些 希望 自己 编写 的 C 语 言 (或 C++ 
语言 ) 的 程序 可 移植 的 程序 员 来 说 意味 着 什么 呢 ? 

首先 ， 需 要 检查 你 所 使 用 的 库 函数 是 否 被 列 在 了 LSB 规 范 中 。 如 果 它 不 在 这 个 规范 中 ， 你 所 编写 
的 程序 就 可 能 不 会 那么 容易 地 被 移植 ， 这 时 就 需要 查找 一 种 标准 的 方法 来 执行 你 想 要 完成 的 工作 。 你 
可 能 需要 用 Linux 命 令 apropos 来 搜索 在 线 手册 页 ， 以 找到 合适 的 帮助 页 面 。 

其 次 ， 也 是 更 困难 的 一 步 ， 就 是 检查 你 所 使 用 的 函数 行为 是 否 是 规范 定义 的 行为 ， 并 且 没有 在 程 
序 中 依赖 系统 特定 的 函数 行为 。 如 果 函 数 的 用 法 未 在 LSB 中 定义 , 你 可 能 不 得 不 参考 单一 UNIX 规 范 来 
检查 。 

用 于 检查 未 定义 或 可 能 产生 错误 行为 的 函数 的 一 个 非常 好 的 方法 是 使 用 Linux 的 在 线 手册 。 手 册 
中 的 许多 页 面 都 包含 一 个 BUGS 漏洞) 小 节 ， 它 是 一 个 无 价 的 信息 来 源 。 它 可 以 告诉 我 们 ，Linux 中 
的 某 个 特定 函数 调用 可 能 没有 完全 按照 标准 中 的 定义 来 实现 , 或 者 它 在 执行 时 有 一 些 已 知 的 漏洞 或 奇 
怪 的 行为 。 


18.22 LSB 用 户 和 组 


规范 中 这 一 部 分 的 内 容 非常 简明 且 容易 理解 。 下 面 是 一 些 规范 中 的 定义 。. 
O 它 告诉 我 们 ， 一 定 不 能 直接 读 取 如 /etc/passwa 这 样 的 文件 ， 而 是 应 该 总 是 使 用 如 getpwent 
这 样 的 标准 库 函数 调用 或 者 如 passwd 这 样 的 标准 工具 来 访问 用 户 详细 信息 。 
O 它 告诉 我 们 ， 在 root 组 中 必须 有 一 个 名 为 root 的 用 户 ， 这 个 root 用 户 是 一 个 拥有 全 部 权限 的 管理 
员 。 同 时 还 有 一 组 可 选 的 用 户 和 组 也 绝对 不 能 在 标准 应 用 程序 中 使 用 ， 它 们 由 Linux 发 行 版 自 
身 来 使 用 。 
口 它 还 告诉 我 们 ， 用 户 ID 小 于 100 的 账号 是 系统 账号 ， 用 户 ID 在 100 到 499 之 间 的 账号 是 由 系统 管 
理 员 和 安装 后 脚本 分 配 的， 用 户 ID 在 500 及 其 以 上 的 账号 用 于 普通 用 户 。 
一 般 来 说 ， 上 面 这 些 内 容 对 大 多 数 需要 了 解 用 户 标准 的 Linux 程 序 员 来 说 已 足够 。 
18.2.3 LSB 系统 初始 化 
至 少 对 于 我 们 来 说 ， 系 统 初始 化 方面 的 内 容 总 是 一 件 在 不 同 Linux 发 行 版 之 间 有 着 细微 区 别 的 让 
人 烦恼 的 事情 。 
Linux 继 承 了 类 UNIX 操 作 系统 运行 级 别 的 思想 ， 运 行 级 别 定义 了 在 不 同 级 别 中 允许 启动 的 服务 。 
对 于 Linux 来 说 ， 常 见 的 运行 级 别 定义 见 表 18-1。 
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表 18-1 
运行 级 别 说 明 
0 停止 。 用 作 一 种 可 以 在 系统 关闭 时 切换 到 的 逻辑 状态 
1 单 用 户 模式 。 非 根 目录 的 其 他 目录 可 能 不 会 在 这 种 模式 下 被 装载 ， 网 络 功能 也 将 被 禁用 。 这 个 模 


式 通常 用 于 系统 维护 
多 用 户 模式 ， 但 未 启用 网 络 功能 
正常 的 带 网 络 功能 的 多 用 户 模式 ， 使 用 文本 模式 的 登录 界面 
保留 
正常 的 带 网 络 功 能 的 多 用 户 模式 ， 使 用 图 形 登录 界面 
用 于 重启 系统 的 伪 运 行 级 别 
LSB 列 出 了 这 些 运行 级 别 ， 但 并 不 要 求 使 用 它们 ， 但 实际 上 它们 是 非常 常见 的 。 
与 这 些 运行 级 别 相伴 的 是 一 组 用 于 启动 、 关 闭 和 重启 服务 的 初始 化 脚本 。 以 前 的 Linux 系 统 会 将 
这 些 脚本 放 在 /etc 目 录 下 的 不 同位 置 ， 一 般 是 放 在 目录 /etc/init.d 或 /etc/rc.a/init.da 下 。 这 种 
不 确定 性 通常 让 用 户 困惑 ， 因 为 当 他 们 更 换 了 Linux 发 行 版 后 ， 他 们 就 不 能 在 期 望 的 目录 下 找到 初始 
化 脚本 了 ， 而 且 在 安装 程序 时 ， 当 你 试图 将 初始 化 脚本 放 在 一 个 错误 的 目录 下 时 ， 也 会 导致 安装 程序 
失败 。 
LSB 3.1 将 这 些 初始 化 脚本 放置 的 目录 定义 为 /etc/init.d, 但 它 也 允许 这 个 目录 可 以 是 对 其 他 目 
录 的 一 个 连接 。 
在 /etc/init.a 目 录 中 的 每 个 脚本 都 有 一 个 与 其 提供 的 服务 相关 联 的 名 字 。 由 于 这 是 在 Linux 系 统 
中 所 有 服务 必须 共享 的 一 个 公用 命名 空间 ， 所 以 保证 名 字 的 唯一 性 是 非常 重要 的 。 例 如， 如 果 MySQL 
和 PostgreSQL 都 决定 将 它们 的 脚本 命名 为 database, 那么 情况 就 会 变 得 比较 复杂 。 为 了 避免 发 生 这 样 的 
冲突 ， 我 们 还 有 另外 一 组 标准 ， 它 就 是 “Linux 分 配 名 字 和 数字 机 构 ”(Linux Assigned Names And 
Numbers Authority， 简 称 为 LANANA )， 它 的 网 址 为 http://www.lanana.org/。 幸 运 的 是 ， 你 不 需要 对 它 
了 解 太 多 ， 只 需要 知道 它 维护 了 一 个 已 注册 脚本 和 软件 包 名 字 列 表 ， 从 而 减轻 了 Linux 系 统 用 户 的 工 
作 负 担 。 
初始 化 脚本 必须 用 一 个 参数 来 控制 它 的 行为 。 已 定义 的 参数 见 表 18-2。 
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5 "m 说 了 明 
start 启动 (或 重启 ) 服务 
stop 停止 服务 
restart 重启 服务 ， 它 一 般 是 通过 先 停止 服务 再 重启 服务 的 方式 来 实现 的 
reload 重 置 服务 ， 在 不 停止 服务 的 情况 下 重新 装载 所 有 的 参数 。 并 不 是 所 有 的 服务 都 支持 这 个 选项 ， 


所 以 这 个 参数 可 能 并 不 能 被 所 有 的 脚本 所 支持 ， 或 者 是 虽然 被 脚本 接受 ， 但 不 会 产生 任何 效果 
force-reload 如 朵 服务 支持 这 个 选项 ， 就 重 载 服务 ， 否 则 ， 就 重启 服务 
status 以 文本 方式 打印 服务 的 状态 信息 ， 并 返回 一 个 可 以 用 来 确定 服务 状态 的 状态 码 


所 有 的 命令 在 成 功 时 返回 0， 失 败 时 返回 表明 错误 原因 的 错误 代码 。 使 用 status 参 数 时 ， 如 果 服 
务 正在 运行 则 返回 9，， 否 则 返回 表明 服务 没有 运行 原因 的 状态 码 。 


18.8 ”文件 系统 层次 结构 标准 
在 本 章 中 我 们 要 介绍 的 最 后 一 个 标准 是 文件 系统 层次 结构 标准 (Filesystem Hierarchy Standard, 
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简称 为 FHS)， 它 的 网 址 为 http:Wwww:pathname .com/fhs/。 

这 个 标准 的 目的 是 定义 Linux 文 件 系统 的 标准 路 径 ， 使 得 开发 者 和 用 户 可 以 在 合理 的 位 置 找到 需 
要 的 东西 。 长 期 以 来 ， 使 用 不 同类 UNIX 操 作 系统 的 用 户 都 对 文件 系统 布局 的 细微 区 别 感到 无 奈 ， 而 
FHS 向 Linux 发 行 版 提供 了 一 种 方法 来 避免 这 样 的 问题 。 

乍 看 起 来 ，Linux 系 统 中 的 文件 布局 好 像 是 对 文件 和 目录 基于 历史 实践 的 一 种 比较 随意 的 安排 。 
从 某 种 程度 上 来 说 , 事实 确实 如 此 , 但 这 种 布局 是 经 过 多 年 的 合理 演变 才 形 成 我 们 今天 见 到 的 构架 的 。 
大 体 的 想法 是 将 文件 和 目录 分 为 如 下 3 组 。 

O 对 运行 Linux 的 某 一 特定 系统 唯一 的 文件 和 目录 ， 例 如 启动 脚本 和 配置 文件 

O 可 以 在 运行 Linux 的 不 同系 统 之 间 共 享 的 只 读 文 件 和 目录 ， 例 如 可 执行 应 用 程序 。 

O 可 以 在 运行 Linux 或 其 他 操作 系统 的 不 同系 统 之 间 共享 的 可 读 可 写 的 目录 ， 例 如 用 户 家 目录 。 

虽然 ， 在 一 个 由 Linux 机 器 组 成 的 网 络 中 ， 确 保 只 有 一 份 主要 程序 目录 的 副本 ， 并 且 可 以 在 许多 
机 器 之 间 共 享 是 非常 好 的 做 法 ， 但 在 本 书 中 ， 我 们 对 在 不 同 版 本 的 Linux 系 统 之 间 共享 文件 并 不 是 太 
感 兴趣 。 这 种 做 法 只 对 无 盘 工 作 站 特别 有 用 。 

FHS 定 义 的 顶级 结构 包含 一 些 必须 存在 的 子 目录 和 一 小 部 分 可 选 的 目录 ， 如 表 18-3 所 示 。 
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重要 的 系统 二 进 制 文件 

启动 系统 所 需要 的 文件 

设备 文件 

系统 配置 文件 

用 于 放置 用 户 文件 的 目录 

标准 函数 库 

用 于 装载 可 移动 媒体 的 位 置 ， 它 针对 每 一 个 系统 支持 的 媒体 类 型 都 有 一 个 单独 的 子 目录 

方便 临时 装载 如 CD-ROM 和 闪存 棒 等 设备 的 目录 

其 他 应 用 程序 软件 

root 用 户 的 文件 

在 系统 启动 时 需要 的 重要 的 系统 二 进 制 文件 

用 于 系统 提供 的 服务 的 只 读数 据 

临时 文件 

第 二 级 的 目录 层次 ， 传 统 上 用 户 的 文件 也 可 以 放置 在 这 个 目录 下 ， 但 现在 认为 这 是 一 种 
不 好 的 做 法 ， 所 以 普通 用 户 应 该 没有 对 /usr 目 录 的 写 权 限 
/var 是 可 变 的 数据 ， 如 日 志文 件 


另外 ， 可 能 还 会 有 一 些 其 他 目录 也 以 1ib 为 前 绥 ， 但 这 并 不 是 很 常见 。 你 通常 还 会 看 到 目录 
/1ost+found (用 于 fsck 命 令 进行 文件 系统 的 恢复 ) 和 目录 /proc， 后 者 其 实 是 一 个 伪 文 件 系统 ， 它 
提供 了 对 当前 运行 系统 的 一 个 映射 。 当 前 的 FHS 标 准 提 到 了 /proc 文 件 系统 ， 但 并 不 要 求 它 一 定 存在 。 
虽然 我 们 在 第 4 章 简单 介绍 了 /proc 目 录 ， 但 关于 它 的 细节 已 超出 了 本 书 介绍 的 范围 。 
下 面 ， 我 们 将 简单 介绍 根 目录 下 每 个 标准 子 目录 的 用 途 。 
O /bin: 包含 可 以 被 root 用 户 和 普通 用 户 使 用 的 二 进 制 文件 ， 它 们 都 可 以 在 单 用 户 模式 下 运行 ， 
即 在 其 他 一 些 目录 结构 还 未 装载 的 情况 下 也 能 单独 运行 。 例 如 ， 核 心 命令 如 cat 和 1s 都 可 以 在 
这 里 找到 ， 当 然 也 包括 命令 sh。 


/tmp 
/usr 


d 
Pom pom om gm opm opm op mb mom om op 
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口 /boot: 这 个 目录 下 放置 的 是 启动 Linux 系 统 时 所 需 使 用 的 文件 。 这 些 文件 通常 都 比较 小 ， 文 
件 长 度 不 超过 100 MB。 我 们 通常 会 为 这 个 目录 单独 划分 一 个 分 区 ， 在 基于 PC 的 系统 中 这 样 做 
非常 方便 ,但 由 于 BIOS 通 常会 对 活动 分 区 有 所 限制 ， 所 以 需要 将 该 分 区 分 配 在 磁盘 的 前 2 GR 
4 G 空 间 中 。 为 这 个 目录 单独 划分 一 个 分 区 ， 可 以 使 我 们 在 决定 如 何 分 配 剩 余 的 磁盘 空间 时 更 
灵活 。 

口 /dev: 这 个 目录 下 放置 的 是 映射 到 硬件 的 特殊 设备 文件 。 例 如 /aev/haa 将 映射 到 第 一 个 IDE 
磁盘 。 

O /ete: 这 个 目录 下 放置 的 是 配置 文件 。 历 史上 有 些 二 进 制 文件 也 放置 在 这 个 目录 下 ， 但 在 现 
在 的 大 多 数 Linux 系 统 中 都 不 会 再 出 现 这 种 情况 。 在 /etc 目 录 下 最 有 名 的 文件 可 能 就 是 passwad 
文件 ， 它 包含 系统 中 用 户 的 信息 。 其 他 有 用 的 文件 有 fstab《〈 列 出 分 区 装载 选项 )、hosts〈 列 
出 IP 地 址 和 主机 名 的 映射 关系 )、httpa 目 录 ( 包 含 Apache 服 务 器 的 配置 文件 )。 

口 /home: 这 是 用 于 放置 用 户 文件 的 目录 。 正 常情 况 下 ， 每 个 用 户 都 会 在 这 个 目录 下 有 一 个 与 他 
们 的 登录 名 相同 的 子 目录 ， 而 这 个 子 目 录 就 是 他 们 的 默认 登录 目录 。 例 如 ， 用 户 rick 在 登录 
进 系统 后 ， 将 会 发 现 自己 位 于 目录 /home/rick 中 。 

O /1ib: 这 个 目录 下 放置 的 是 基本 的 共享 函数 库 和 内 核 模块 ， 特 别 是 那些 在 系统 启动 或 系统 位 
于 单 用 户 模式 时 需要 用 到 的 文件 。 

O /media: 这 个 顶级 目录 用 于 包含 装载 可 移动 媒体 的 其 他 子 目录 。 其 目的 是 消除 不 必要 的 顶级 
目录 ， 如 /cdrom 和 /floppy。 

O /mnt: 这 个 目录 只 是 用 来 方便 用 户 临 时 装载 一 些 其 他 的 文件 系统 。 以 前 ， 一 些 Linux 发 行 版 还 
会 在 该 目录 中 针对 不 同 的 设备 添加 一 些 子 目录 ， 如 /mnt 目 录 下 的 carom 和 floppy 子 目录 ， 但 现 
在 用 于 装载 这 些 设备 的 首选 位 置 是 在 /media 目 录 下 ，/mnt 目 录 将 作为 一 个 顶级 的 临时 装载 位 置 。 

O /opt: 软件 厂商 在 向 系统 中 添加 软件 时 会 用 到 这 个 目录 。 按 照 惯 例 ，Linux 发 行 版 一 般 不 会 将 
自己 发 布 的 软件 放置 在 这 个 目录 下 ， 而 是 将 这 个 目录 开放 给 第 商 来 使 用 。 厂 商 通常 会 
在 这 个 目录 下 以 它们 的 名 字 创 建 一 个 子 目录 ， 然 后 针对 它们 的 应 用 程序 ， 在 这 个 子 目 录 下 继 
续 创建 如 /bin 和 /1ib 等 子 目 录 。 
按照 惯例 ， 大 多 数 开放 源码 的 Linux 软 件 包 将 目录 /usr/1ocal 作 为 它们 的 安装 点 。 

O /root: 这 个 目录 下 放置 的 是 root 用 户 使 用 的 文件 。 它 并 没有 放置 在 /home 目 录 下 的 原因 是 ， 
在 单 用 户 模式 下 ，/home 目 录 可 能 未 被 装载 进 系统 。 

口 /sbin: 这 个 目录 下 放置 的 是 通常 只 能 由 系统 管理 员 使 用 的 命令 ， 以 及 在 系统 启动 时 或 进入 单 

用 户 模 式 时 需要 使 用 的 命令 。 命 令 fsck、halt 和 swapon 等 就 在 这 个 目录 中 。 

/srv: 这 个 目录 用 于 放置 站 点 特定 的 只 读 配 置 数 据 ， 但 它 目前 还 未 被 普遍 使 用 。 

/tmp: 这 个 目录 下 放置 的 是 临时 文件 。 系 统 通常 会 在 〈 但 并 不 总 是 ) 启动 时 清理 这 个 目录 。 

/usr: 这 是 一 个 相当 复杂 的 二 级 文件 系统 ， 在 这 个 目录 下 ， 通 常 将 包含 除 在 系统 启动 或 进入 

单 用 户 模式 所 需要 的 文件 以 外 的 所 有 系统 类 的 命令 和 函数 库 。 它 包含 许多 子 目录 ， 如 /bin、 

/1ib、/X11R6 和 /local。 

在 UNIX 和 Linux 发 展 的 早期 ，/usr 目 录 下 还 有 用 于 记录 日 志和 放置 邮件 队列 等 的 子 目 

录 ， 但 现在 它们 都 已 经 从 usr 目 录 下 移出 并 放置 到 var 目 录 中 。 这样 做 的 好 处 是 ，/usr 目 录 

作为 一 个 可 装载 的 文件 系统 ， 可 以 在 大 部 分 时 间 里 以 只 读 的 方式 装载 到 系统 中 。 当 /usr 目 录 

以 只 读 方式 装载 时 , 它 可 以 通过 网 络 与 其 他 系统 共享 , 而且 当 系统 由 于 一 些 不 可 控制 的 原因 ， 
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如 断 电 而 造成 停机 时 ， 这 个 目录 中 的 内 容 也 不 容易 遗 到 损坏 . 


口 /var: 这 个 目录 下 放置 的 数据 是 会 经 常 改变 的 ， 如 用 于 打印 的 队列 文件 、 应 用 程序 的 日 志 
件 和 邮件 队列 目录 等 。 


18.4 更 多 标准 


如 果 你 想 编写 利 分 发 一 个 具备 完全 可 移植 性 的 Linux 应 用 程序 ， 除 了 上 面 所 介绍 的 内 容 外 ， 当 然 
还 需要 考虑 许多 其 他 事情 。 

你 想 本 地 化 应 用 程序 ， 让 它 可 以 在 不 同 的 地 点 、 使 用 不 同 的 语言 运行 吗 ? 即使 你 在 程序 中 坚持 使 
用 英语 ， 你 仍然 需要 考虑 如 货币 、 数 字 分 隔 符 和 日 期 格式 等 许多 其 他 问题 。 你 猜 对 了 ， 人 们 正在 对 这 
些 事务 进行 标准 化 ， 你 可 以 访问 http://www.openil8n.org/ 来 查看 它们 的 标准 化 情况 。 

编写 应 用 程序 时 ， 另 一 个 需要 考虑 的 问题 是 目标 系统 安装 了 哪个 版 本 的 函数 库 ， 它 使 用 的 选项 是 
什么 ， 等 等 。 幸 运 的 是 ， 由 于 我 们 在 本 章 中 所 看 到 的 标准 化 工作 ， 这 个 问题 已 经 显得 不 那么 明显 ， 但 
它 仍然 是 一 个 比较 困难 的 问题 , 有 一 组 GNU 工 具 可 以 极 大 地 帮助 我 们 解决 这 一 问题 , 它们 是 autoconf 
和 automake。 虽 然 你 可 能 不 会 直接 使 用 它们 ， 但 当 通过 源 代码 安装 软件 ， 在 命令 行 键 入 命 
令 ./configure; make 时 ， 你 几乎 肯定 会 看 到 它们 带 来 的 好 处 。 

这 些 工具 的 用 法 已 超出 了 本 书 介绍 的 范围 ， 但 你 可 以 通过 GNU 的 网 站 http://www.gnu.org/ 
software/autoconf 和 http://www.gnu.org/software/automake 找 到 关于 它们 的 更 多 信 


18.5 小 结 


在 本 章 中 , 我 们 简单 介绍 了 众多 UNIX 标 准 中 的 一 部 分 , 它们 帮助 Linux 成 为 一 个 易于 编程 的 平台 
并 且 确保 许多 不 同 的 Linux 发 行 版 遵守 一 些 基本 的 标准 。 遵 守 标准 可 以 让 编程 人 员 和 用 户 的 工作 变 得 
更 加 轻松 ， 所 以 我 们 要 求 和 鼓励 读者 使 用 标准 。 








